광고
광고
광고
광고
광고
광고
광고
광고
광고
광고
광고
광고
광고
로고

[인공지능] DeepMind가 개발한 AlphaTensor라 알고리즘은 체스와 바둑에서 인간 플레이어를 이긴 것으로 유명하다. AlphaTensor는 AI가 인간이 엔지니어링하는 어떤 것보다 뛰어난 프로그램을 설계하는 동시에 자체 기계 "두뇌"를 개선하는 새로운 세계로 가는 길을 열어준다. 발견한 솔루션은 컴퓨팅 실행 시간을 개선하기 위해 즉시 개발될 수 있다.

https://singularityhub.com/2022/10/11/deepmind-ai-one-ups-mathematicians-at-a-calculation-crucial-to-computing/

JM Kim | 기사입력 2022/10/13 [00:00]

[인공지능] DeepMind가 개발한 AlphaTensor라 알고리즘은 체스와 바둑에서 인간 플레이어를 이긴 것으로 유명하다. AlphaTensor는 AI가 인간이 엔지니어링하는 어떤 것보다 뛰어난 프로그램을 설계하는 동시에 자체 기계 "두뇌"를 개선하는 새로운 세계로 가는 길을 열어준다. 발견한 솔루션은 컴퓨팅 실행 시간을 개선하기 위해 즉시 개발될 수 있다.

https://singularityhub.com/2022/10/11/deepmind-ai-one-ups-mathematicians-at-a-calculation-crucial-to-computing/

JM Kim | 입력 : 2022/10/13 [00:00]

DeepMind가 다시 해냈다.  

 

단백질 구조 예측과 같은 생물학의 근본적인 문제를 해결하고 매듭 이론의 수학을 풀고 나면 수천 개의 일상적인 응용 프로그램에 내장된 기본적인 컴퓨팅 프로세스를 목표로 한다. 이미지 구문 분석에서 날씨 모델링 또는 인공 신경망의 내부 작동 조사에 이르기까지 AI는 이론적으로 다양한 분야에서 계산 속도를 높여 에너지 사용과 비용을 줄이는 동시에 효율성을 높일 수 있다.

 

그러나 더 인상적인 것은 그들이 그것을 한 방법이다. AlphaTensor라는 기록을 깨는 알고리즘은 체스와 바둑에서 인간 플레이어를 이긴 것으로 유명한 AlphaZero의 파생물이다.

 

공동 저자 DeepMind Matej Balog Alhussein Fawz 박사들은 "그러나 알고리즘을 발견하는 것은 매우 어렵다."고 말했다.

 

AlphaTensor AI가 인간이 엔지니어링하는 어떤 것보다 뛰어난 프로그램을 설계하는 동시에 자체 기계 "두뇌"를 개선하는 새로운 세계로 가는 길을 열어준다.

 

네이처(Nature)의 선임 편집자인 페데리코 레비(Federico Levi) 박사는이 작업은 사람들이 수십 년 동안 연구해 온 최적화 문제에 AI를 사용함으로써 미지의 영역으로 나아가고 있다. 발견한 솔루션은 컴퓨팅 실행 시간을 개선하기 위해 즉시 개발될 수 있다.”고 말했다. 연구를 발표한 것이다.

 

행렬 곱셈 입력

 

AlphaTensor가 직면한 문제는 행렬 곱셈이다. 갑자기 화면 아래로 스크롤되는 녹색 숫자의 행과 열이 생각난다면 혼자가 아니다. 대략적으로 말하면 행렬은 선택한 데이터를 디지털 방식으로 나타내는 숫자 그리드와 같은 종류이다. 이미지의 픽셀, 사운드 클립의 주파수 또는 비디오 게임에서 캐릭터의 모양과 동작이 될 수 있다.

 

행렬 곱셈은 두 개의 숫자 그리드를 사용하여 하나씩 곱한다. 고등학교에서 자주 가르치는 계산이지만 컴퓨팅 시스템에도 중요하다. 여기에서 한 행렬의 숫자 행이 다른 행렬의 열과 곱해진다. 결과는 비디오 게임 장면을 확대하거나 기울이는 명령과 같은 결과를 생성한다. 이러한 계산은 내부적으로 작동하지만 전화나 컴퓨터를 사용하는 사람은 매일 결과에 의존한다.

 

문제가 어떻게 극도로 어려워지고 극도로 빨라질 수 있는지 알 수 있다. 큰 행렬을 곱하는 것은 엄청나게 에너지와 시간 집약적이다. 새 행렬을 구성하려면 각 숫자 쌍을 개별적으로 곱해야 한다. 행렬이 늘어남에 따라 문제는 빠르게 해결될 수 없게 된다. 최고의 체스나 바둑을 예측하는 것보다 훨씬 더 그렇다. 일부 전문가들은 우주의 원자 수보다 행렬 곱셈을 푸는 방법이 더 많다고 추정한다.

 

1969년에 독일 수학자 Volker Strassen 2x2 행렬 곱셈의 한 라운드를 총 8에서 7로 줄이는 방법이 있음을 보여주었다. 인상적이지는 않지만 Strassen의 방법은 행렬 곱셈에 대해 오랫동안 유지되어 온 연산 표준, 즉 알고리즘을 능가할 수 있음을 보여주었다그의 접근 방식인 Strassen 알고리즘은 50년 넘게 가장 효율적인 접근 방식으로 군림했다.

 

하지만 더 효율적인 방법이 있다면 어떨까? 이 작업에 참여하지 않은 일본 나고야 대학의 François Le Gall 박사는 MIT Technology Review "아무도 이를 해결하기 위한 최고의 알고리즘을 알지 못한다."고 말했다. "컴퓨터 과학에서 가장 큰 미해결 문제 중 하나이다."

 

AI 추적 알고리즘

 

인간의 직관이 흔들리고 있다면 기계적인 마음을 이용해보는 건 어떨까?

 

새로운 연구에서 DeepMind 팀은 행렬 곱셈을 게임으로 전환했다. 전임자 AlphaZero와 유사하게 AlphaTensor는 생물학적 뇌가 학습하는 방식에서 영감을 받은 머신러닝 방법인 심층 강화 학습을 사용한다. 여기에서 AI 에이전트(종종 인공 신경망)는 환경과 상호 작용하여 다단계 문제를 해결한다. 성공하면 "보상"을 얻는다, AI의 네트워크 매개변수가 업데이트되어 향후 다시 성공할 가능성이 높아진다.

 

팬케이크 뒤집기를 배우는 것과 같다. 처음에는 많은 것이 바닥에 떨어지지만 결국 신경망은 완벽한 플립을 위해 팔과 손의 움직임을 학습하게 된다.

 

AlphaTensor의 훈련장은 일종의 3D 보드 게임이다. 본질적으로 스도쿠와 거의 유사한 1인용 퍼즐이다. AI는 가능한 한 가장 적은 단계로 숫자 그리드를 곱하는 동시에 1조 개 이상의 허용 가능한 무수한 움직임 중에서 선택해야 한다.

 

이러한 허용 가능한 움직임은 AlphaTensor에 세심하게 설계되었다. 공동 저자인 Hussain Fawzi 박사는 언론 브리핑에서 다음과 같이 설명했다.

 

다시 말해서, 엄청나게 다양한 옵션에 직면했을 때 건초 더미에서 바늘을 찾을 확률을 높이기 위해 어떻게 좁힐 수 있을까? 전체 건초 더미를 파지 않고 바늘에 도달하기 위해 어떻게 가장 좋은 전략을 세울 수 있을까?

 

팀이 AlphaTensor에 통합한 한 가지 트릭은 트리 검색이라는 방법이다. 은유적으로 말하자면, 무작위로 건초더미를 파헤치는 대신, 여기서 AI는 더 나은 결과로 이어질 수 있는 "도로"를 조사한다. 그런 다음 중간 학습은 AI가 성공 가능성을 높이기 위해 다음 단계를 계획하는 데 도움이 된다. 팀은 또한 어린이에게 체스의 시작 동작을 가르치는 것과 같은 성공적인 게임의 알고리즘 샘플을 보여주었다. 마지막으로 AI가 가치 있는 움직임을 발견하면 팀은 더 나은 결과를 찾기 위해 더 맞춤화 된 학습을 위해 해당 작업을 재정렬할 수 있었다.

 

새로운 지평을 열다

 

AlphaTensor는 잘 작동했다일련의 테스트에서 팀은 최대 5x5 행렬, 즉 행이나 열에 각각 5개의 숫자가 있는 행렬에 대한 가장 효과적인 솔루션을 찾기 위해 AI에 도전했다.

 

이 알고리즘은 Strassen의 원래 해킹을 빠르게 재발견했지만 이전에 인간의 마음이 고안한 모든 솔루션을 능가했다. 다양한 크기의 행렬로 AI를 테스트한 결과 AlphaTensor 70개 이상에 대해 보다 효율적인 솔루션을 찾았다. "사실 AlphaTensor는 일반적으로 각 크기의 행렬에 대해 수천 개의 알고리즘을 발견한다."고 팀은 말했다. “정신이 멍해진다.”

 

5x5 행렬에 4x5 행렬을 곱한 경우 AI는 이전 기록인 80개의 개별 곱셈을 76개로 줄였다. 또한 더 큰 행렬에서도 빛을 발하여 두 개의 11x11 행렬에 필요한 계산 수를 919에서 896으로 줄였다.

 

팀은 개념 증명을 손에 들고 실제 사용으로 전환했다. 컴퓨터 칩은 종종 그래픽을 위한 GPU 또는 머신러닝을 위한 AI 칩과 같은 다양한 계산을 최적화하도록 설계되며 알고리즘을 가장 적합한 하드웨어와 일치시키면 효율성이 높아진다.

 

여기에서 팀은 AlphaTensor를 사용하여 머신러닝에서 널리 사용되는 두 가지 칩인 NVIDIA V100 GPU Google TPU에 대한 알고리즘을 찾았다. 전체적으로 AI가 개발한 알고리즘은 계산 속도를 최대 20%까지 높였다.

 

AI가 스마트폰, 노트북 또는 기타 일상적인 장치의 속도도 높일 수 있는지 여부를 말하기는 어렵다. 그러나 MIT의 버지니아 윌리엄스(Virginia Williams) 박사는 "실제로 사용할 수 있다면 이 개발이 매우 흥미진진할 것"이라고 말했다. "성능 향상은 많은 응용 프로그램을 개선할 것이다."

 

AI의 마음

 

AlphaTensor가 행렬 곱셈에 대한 최신 인간 기록을 경신했음에도 불구하고 DeepMind 팀은 아직 그 이유를 설명할 수 없다.

 

DeepMind 과학자이자 공동 저자인 Pushmeet Kohli박사는 언론 브리핑에서 "이 게임을 플레이함으로써 놀라운 직관력을 갖게 되었다."고 말했다.

 

진화하는 알고리즘은 또한 사람 대 기계일 필요가 없다.

 

AlphaTensor는 더 빠른 알고리즘을 향한 디딤돌이지만 더 빠른 알고리즘도 존재할 수 있다. "특정 형식의 알고리즘으로 검색을 제한해야 하기 때문에 더 효율적일 수 있는 다른 유형의 알고리즘을 놓칠 수 있다."라고 Balog Fawzi는 썼다.

 

아마도 훨씬 더 흥미로운 경로는 인간과 기계의 직관을 결합할 것이다. Williams "이 새로운 방법이 실제로 이전 방법을 모두 포함하는지 또는 이들을 결합하여 더 나은 것을 얻을 수 있는지 여부를 파악하는 것이 좋을 것이다."라고 말했다. 다른 전문가들도 동의한다. 풍부한 알고리즘을 활용하여 과학자들은 AlphaTensor의 솔루션을 작동하게 만든 원인에 대한 단서를 찾기 위해 알고리즘을 해부하여 다음 혁신을 위한 길을 닦을 수 있다.

 

이미지: DeepMind

 
인공지능, DeepMind, AI, AlphaTensor 관련기사목록
광고
광고
광고
광고
광고
광고
많이 본 기사
AIbio소식 많이 본 기사
최신기사