광고
광고
광고
광고
광고
광고
광고
광고
광고
광고
광고
광고
광고
로고

[새로운 멀티 게임 인공지능, 보다 일반적인 지능을 향한 단계] 딥마인드(DeepMind)의 연구원들은 체스, 바둑, 포커에서 인간을 이길 수 있는 모델을 만들기 위해 두 가지 접근 방식의 요소를 결합했다. 팀은 이 혁신이 다양한 작업을 해결하는 방법을 학습할 수 있는 보다 일반적인 AI 알고리즘을 만들기 위한 노력을 가속화할 수 있다고 주장한다.

https://singularityhub.com/2023/11/20/deepmind-says-new-multi-game-ai-is-a-step-toward-more-general-intelligence/

JM Kim | 기사입력 2023/11/22 [00:00]

[새로운 멀티 게임 인공지능, 보다 일반적인 지능을 향한 단계] 딥마인드(DeepMind)의 연구원들은 체스, 바둑, 포커에서 인간을 이길 수 있는 모델을 만들기 위해 두 가지 접근 방식의 요소를 결합했다. 팀은 이 혁신이 다양한 작업을 해결하는 방법을 학습할 수 있는 보다 일반적인 AI 알고리즘을 만들기 위한 노력을 가속화할 수 있다고 주장한다.

https://singularityhub.com/2023/11/20/deepmind-says-new-multi-game-ai-is-a-step-toward-more-general-intelligence/

JM Kim | 입력 : 2023/11/22 [00:00]

AI는 인간에게 알려진 가장 복잡한 게임 중 일부를 마스터했지만 모델은 일반적으로 특정 종류의 문제를 해결하도록 맞춤화되어 있다. 훨씬 더 다양한 게임을 다룰 수 있는 새로운 딥마인드(DeepMind) 알고리즘은 보다 일반적인 AI를 향한 한 걸음이 될 수 있다고 제작자들은 말한다.

 

AI의 벤치마크로 게임을 사용하는 것은 오랜 역사를 가지고 있다. 1997 IBM의 딥 블루(Deep Blue) 알고리즘이 체스 세계 챔피언 가리 카스파로프(Garry Kasparov)를 꺾었을 때 이 분야의 이정표로 환영받았다. 마찬가지로, 2016 DeepMind의 알파고가 세계 최고의 바둑 선수 중 한 명인 이세돌을 물리쳤을 때 AI의 잠재력에 대한 흥분이 폭발했다.

 

DeepMind는 체스와 장기를 포함한 다양한 게임을 마스터한 모델인 알파제로(AlphaZero)를 통해 이러한 성공을 기반으로 했다. 그러나 이것이 인상적이었던 만큼 AlphaZero는 상대방의 의도를 제외한 게임의 모든 세부 사항을 두 플레이어 모두가 볼 수 있는 완벽한 정보 게임에서만 작동했다. 여기에는 두 플레이어가 항상 보드의 모든 말을 볼 수 있는 바둑 및 체스와 같은 게임이 포함된다.

 

대조적으로, 불완전한 정보 게임에서는 일부 세부 사항이 다른 플레이어에게 숨겨져 있다. 포커는 플레이어가 상대방이 어떤 손을 잡고 있는지 볼 수 없기 때문에 전형적인 예이다. 이제 이런 종류의 게임에서도 전문가를 이길 수 있는 모델이 있지만 그들은 AlphaZero와 같은 알고리즘과는 완전히 다른 접근 방식을 사용한다.

 

이제 DeepMind의 연구원들은 체스, 바둑, 포커에서 인간을 이길 수 있는 모델을 만들기 위해 두 가지 접근 방식의 요소를 결합했다. 팀은 이 혁신이 다양한 작업을 해결하는 방법을 학습할 수 있는 보다 일반적인 AI 알고리즘을 만들기 위한 노력을 가속화할 수 있다고 주장한다.

완벽한 정보 게임을 플레이하기 위해 AI를 구축하는 연구자들은 일반적으로 트리 검색이라는 접근 방식에 의존해 왔다. 이는 잠재적인 이동 순서를 매핑하는 다양한 분기를 통해 게임이 현재 상태에서 진행될 수 있는 다양한 방법을 탐구한다. 알파고는 모델이 반복적으로 플레이하고 실수로부터 학습하여 기술을 개선하는 기계 학습 기술과 트리 검색을 결합했다.

 

불완전한 정보 게임의 경우, 연구자들은 전략적 문제에 대한 가장 합리적인 해결책을 찾기 위해 수학적 모델을 사용하는 게임 이론에 의존하는 경향이 있다. 게임 이론은 다양한 상황에서 사람들이 어떻게 선택하는지 이해하기 위해 경제학에서 광범위하게 사용되며, 그 중 다수는 불완전한 정보와 관련된다.

 

2016년에는 DeepStack이라는 AI가 무제한 포커에서 인간 전문가를 이겼지만 모델은 특정 게임에 매우 특화되어 있었다. 그러나 DeepStack 팀의 대부분은 현재 DeepMind에서 일하고 있으며 DeepStack을 구축하는 데 사용한 기술과 AlphaZero에서 사용된 기술을 결합했다.

스튜던트 오브 게임즈(Student of Games)라고 불리는 새로운 알고리즘은 완벽한 정보 게임과 불완전한 정보 게임을 모두 다루기 위해 트리 검색, 자가 플레이 및 게임 이론의 조합을 사용한다. 사이언스(Science)에 실린 논문에서 연구원들은 이 알고리즘이 AI인 슬럼봇(Slumbot)을 플레이하는 최고의 공개 포커를 이겼으며 알파제로(AlphaZero)와 같은 전문 알고리즘과 일치할 수는 없지만 인간 전문가 수준에서 바둑과 체스도 할 수 있다고 보고했다.

 

그러나 한 가지 분야의 달인이 되기보다는 다재다능한 사람이 되는 것이 AI 연구에서 더 큰 보상이 될 것이다. 딥 러닝은 종종 특정 작업에서 초인적인 성능을 달성할 수 있지만, 광범위한 문제에 적용할 수 있는 보다 일반적인 형태의 AI를 개발하는 것은 더 까다롭다. 연구원들은 완벽하고 불완전한 정보 게임을 모두 다룰 수 있는 모델이 "임의의 환경을 위한 진정한 일반 알고리즘을 향한 중요한 단계"라고 말한다.

 

영국 에딘버러 대학교의 마이클 로바토스(Michael Rovatsos)는 결과에서 너무 많은 것을 추정하지 않는 것이 중요하다고 뉴 사이언티스트에 말했다. AI는 가능한 행동의 수가 제한되고 규칙이 명확하게 정의된 단순하고 통제된 게임 환경 내에서 여전히 작동하고 있었다. 그것은 현실 세계의 지저분한 현실과는 거리가 멀다.

 

그러나 이것이 아주 작은 단계일지라도 단일 모델에서 매우 다른 두 종류의 게임에 대한 선도적인 접근 방식을 결합할 수 있다는 것은 중요한 성과이다. 그리고 이는 확실히 미래에 더 유능하고 일반적인 모델을 위한 청사진이 될 수 있다.

이미지 출처: 하산 파샤(Hassan Pasha) / Unsplash

 
인공지능, 게임, 일반적인 지능, 딥 마인드 관련기사목록
광고
광고
광고
광고
광고
광고
많이 본 기사
최신기사