구글이 AI로 비디오 게임을 재정의한다.
현재 3,470억 달러 규모의 비디오 게임 산업은 엔터테인먼트 업계에서 중요한 역할을 하며 전 세계적으로 30억 명 이상의 사람들을 사로잡았다. 퐁(Pong)과 스페이스 인베이더(Space Invaders)와 같은 간단한 타이틀로 시작된 것이 3D 비주얼과 홈 콘솔 경험으로 새로운 기준을 제시한 둠(Doom)과 같은 보다 정교한 게임으로 진화했다. 비디오 게임을 재정의하는 데 있어 구글의 여정을 살펴본다.
시작: 아타리(Atari) 게임을 플레이하는 AI
구글이 비디오 게임에서 AI를 사용하는 것은 중요한 개발로 시작되었다. 게임 환경을 인식하고 인간 플레이어처럼 반응할 수 있는 AI를 만드는 것이다. 이 초기 작업에서 그들은 게임 플레이에서 직접 제어 전략을 학습할 수 있는 심층 강화 학습 에이전트를 도입했다. 이 개발의 핵심은 Q-학습을 사용하여 학습한 합성 신경망으로, 원시 화면 픽셀을 처리하여 현재 상태를 기반으로 게임별 동작으로 변환했다.
연구자들은 아키텍처나 학습 알고리즘을 수정하지 않고 이 모델을 7개의 Atari 2600 게임에 적용했다. 결과는 인상적이었다. 이 모델은 6개 게임에서 이전 방법보다 성능이 우수했고 3개 게임에서는 인간의 성능을 능가했다. 이 개발은 시각적 입력만으로 복잡하고 대화형 비디오 게임을 처리할 수 있는 AI의 잠재력을 강조했다.
이 획기적인 발전은 DeepMind의 AlphaGo가 Go 세계 챔피언을 물리친 것과 같은 이후의 업적을 위한 토대를 마련했다. AI 에이전트가 어려운 게임을 마스터하는 데 성공한 이후 대화형 시스템 및 로봇 공학을 포함한 실제 세계 응용 프로그램에 대한 추가 연구가 촉진되었다. 이런 발전의 영향은 오늘날에도 머신러닝과 AI 분야에서 느낄 수 있다.
알파스타(AlphaStar): 스타크래프트 II를 위한 복잡한 게임 전략을 학습하는 AI
초기 AI 성공 사례를 바탕으로 구글은 더욱 복잡한 도전 과제인 스타크래프트 II에 주목했다. 이 실시간 전략 게임은 플레이어가 군대를 통제하고, 자원을 관리하고, 실시간으로 전략을 실행해야 하기 때문에 복잡성으로 유명하다. 2019년 구글은 스타크래프트 II를 프로처럼 플레이할 수 있는 AI 에이전트인 AlphaStar를 출시했다.
AlphaStar의 개발은 심층 강화 학습과 모방 학습을 혼합하여 사용했다. 먼저 프로 플레이어의 리플레이를 시청하여 학습한 다음, 수백만 개의 경기를 실행하여 전략을 개선하는 셀프 플레이를 통해 개선했다. 이 업적은 AI가 복잡한 실시간 전략 게임을 처리하여 인간 플레이어와 동일한 결과를 달성할 수 있는 능력을 보여주었다.
개별 게임을 넘어: 게임을 위한 보다 일반적인 AI를 향해
구글의 최신 발전은 개별 게임을 마스터하는 것에서 보다 다재다능한 AI 에이전트를 만드는 것으로의 전환을 의미한다. 최근 구글 연구원들은 자연어 명령을 사용하여 다양한 게임 환경을 탐색하도록 설계된 새로운 AI 모델인 SIMA(Scalable Instructable Multiworld Agent의 약자)를 소개했다. 게임의 소스 코드나 사용자 지정 API에 액세스해야 했던 이전 모델과 달리 SIMA는 화면 이미지와 간단한 언어 명령의 두 가지 입력으로 작동한다.
SIMA는 이러한 명령을 키보드와 마우스 동작으로 변환하여 게임의 중심 캐릭터를 제어한다. 이 방법을 사용하면 인간의 게임 플레이를 반영하는 방식으로 다양한 가상 설정과 상호 작용할 수 있다. 연구에 따르면 여러 게임에서 훈련된 AI가 단일 경기에서 훈련된 AI보다 성능이 더 뛰어나 게임을 위한 새로운 시대의 일반화 또는 기초 AI를 주도할 수 있는 SIMA의 잠재력이 강조되었다.
구글의 진행 중인 작업은 SIMA의 기능을 확장하여 이러한 다재다능한 언어 기반 에이전트를 다양한 게임 환경에서 개발할 수 있는 방법을 탐구하는 것을 목표로 한다. 이 개발은 다양한 상호 작용적 맥락에서 적응하고 번창할 수 있는 AI를 만드는 데 있어 중요한 단계를 나타낸다.
게임 디자인을 위한 생성 AI
최근에 구글은 게임 플레이를 향상시키는 것에서 게임 디자인을 지원하는 도구 개발로 초점을 확대했다. 이러한 변화는 특히 이미지 및 비디오 생성 분야에서 생성 AI의 발전에 의해 주도되었다. 중요한 발전 중 하나는 AI를 사용하여 플레이어의 행동에 더욱 현실적이고 예측할 수 없는 방식으로 대응하는 적응형 비플레이어 캐릭터(NPC)를 만드는 것이다.
또한 구글은 특정 규칙이나 패턴에 따라 레벨, 환경 및 전체 게임 세계를 설계하는 데 AI가 도움이 되는 절차적 콘텐츠 생성을 탐구했다. 이 방법은 개발을 간소화하고 플레이어에게 각 플레이스루에서 고유하고 개인화된 경험을 제공하여 호기심과 기대감을 불러일으킬 수 있다. 주목할 만한 예로는 사용자가 이미지나 설명을 제공하여 2D 비디오 게임을 디자인할 수 있는 도구인 Genie가 있다. 이 접근 방식은 프로그래밍 기술이 없는 사람도 게임 개발을 보다 쉽게 할 수 있게 한다.
Genie의 혁신은 명확한 지침이나 레이블이 지정된 데이터에 의존하지 않고 2D 플랫포머 게임의 다양한 비디오 영상에서 학습할 수 있는 능력에 있다. 이 기능을 통해 Genie는 게임 메커니즘, 물리 및 디자인 요소를 보다 효과적으로 이해할 수 있다. 사용자는 기본적인 아이디어나 스케치로 시작할 수 있으며, Genie는 설정, 캐릭터, 장애물 및 게임플레이 메커니즘을 포함한 완전한 게임 환경을 생성한다.
게임 개발을 위한 생성 AI
이전의 발전을 바탕으로 구글은 최근 가장 야심찬 프로젝트를 출시했다. 이는 전통적으로 광범위한 코딩과 전문 기술이 필요했던 복잡하고 시간이 많이 걸리는 게임 개발 프로세스를 간소화하는 것을 목표로 한다. 최근 그들은 게임 개발 프로세스를 간소화하도록 설계된 생성 AI 도구인 GameNGen을 출시했다. GameNGen을 사용하면 개발자가 자연어 프롬프트를 사용하여 전체 게임 세계와 내러티브를 구축할 수 있으므로 게임을 만드는 데 필요한 시간과 노력이 크게 줄어든다. GameNGen은 생성 AI를 활용하여 고유한 게임 자산, 환경 및 스토리라인을 생성하여 개발자가 기술적인 면보다는 창의성에 더 집중할 수 있도록 한다. 예를 들어, 연구자들은 GameNGen을 사용하여 둠(Doom)의 전체 버전을 개발하여 기능을 시연하고 보다 효율적이고 접근 가능한 게임 개발 프로세스를 위한 길을 열었다.
GameNGen의 기술에는 2단계 교육 프로세스가 포함된다. 먼저 AI 에이전트가 둠(Doom)을 플레이하도록 교육하여 게임플레이 데이터를 만든다. 그런 다음 이 데이터는 이전 동작과 비주얼을 기반으로 미래 프레임을 예측하는 생성 AI 모델을 교육한다. 그 결과, 기존 게임 엔진 구성 요소 없이 실시간 게임 플레이를 제작할 수 있는 생성 확산 모델이 탄생했다. 수동 코딩에서 AI 기반 생성으로의 이러한 전환은 게임 개발에 있어 중요한 이정표를 나타내며, 소규모 스튜디오와 개별 크리에이터를 위해 고품질 게임을 제작하는 보다 효율적이고 접근 가능한 방법을 제공한다.
결론
구글의 최근 AI 발전은 게임 산업을 근본적으로 재편할 준비가 되었다. GameNGen과 같은 도구는 세부적인 게임 세계를 만들 수 있게 하고 SIMA는 다양한 게임플레이 상호 작용을 제공하므로 AI는 게임을 만드는 방법뿐만 아니라 게임을 경험하는 방법도 변화시키고 있다.
AI가 계속 발전함에 따라 게임 개발에서 창의성과 효율성을 향상시킬 것으로 기대된다. 개발자는 혁신적인 아이디어를 탐구하고 더욱 매력적이고 몰입감 있는 경험을 제공할 수 있는 새로운 기회를 갖게 될 것이다. 이러한 변화는 비디오 게임의 지속적인 진화에서 중요한 순간을 나타내며 대화형 엔터테인먼트의 미래를 형성하는 데 있어 AI의 역할이 커지고 있음을 강조한다.