AI가 안내하는 뇌를 가진 사이보그 벌레
이 방법은 AI 플레이어가 바둑과 같은 게임을 마스터하는 방법을 배우는 데 사용된다. 생물학적 뇌를 대략적으로 모델로 한 소프트웨어인 인공 신경망은 일련의 행동과 결과를 분석하여 AI "에이전트"가 환경과 상호 작용하고 목표를 달성하기 위한 전략을 추출한다.
네이쳐 머신 인텔리전스(Nature Machine Intelligence)에 게재된 연구에서 연구자들은 AI 에이전트를 훈련하여 1밀리미터 길이의 선충류 Caenorhabditis elegans 벌레를 4센티미터 접시에 있는 맛있는 대장균 패치로 안내하도록 했다. 근처 카메라는 모든 벌레의 머리와 몸의 위치와 방향을 기록했다. 에이전트는 초당 3회 이전 15개 프레임에 대한 이 정보를 받아 각 순간의 과거와 현재에 대한 감각을 제공했다. 에이전트는 또한 접시를 향해 조명을 켜거나 끌 수 있다. 이 벌레는 광유전학적으로 설계되어 특정 신경 세포가 빛에 반응하여 활성화되거나 비활성화되고, 때로는 움직이기도 한다.
연구팀은 빛에 민감한 뉴런의 수가 벌레가 소유한 302개에서 1개까지 다양한 6개의 유전적 계통을 테스트했다. 자극은 각 계통에서 다른 효과를 발휘하여, 예를 들어 벌레가 방향을 바꾸거나 방향을 바꾸지 못하게 했다. 과학자들은 먼저 5시간 동안 벌레에게 무작위로 빛을 비추어 훈련 데이터를 수집한 다음, 에이전트를 풀어주기 전에 패턴을 찾기 위해 AI 에이전트에게 데이터를 제공했다.
모든 뉴런이 빛에 반응하는 선을 포함하여 6개 계통 중 5개에서 에이전트는 벌레를 홀로 두거나 빛이 무작위로 깜박였을 때보다 더 빠르게 벌레를 표적으로 유도하는 법을 배웠다. 게다가 에이전트와 벌레는 협력했다. 에이전트가 벌레를 표적으로 바로 조종했지만 경로에 작은 장애물이 있는 경우 벌레는 그 주변을 기어갔다.
호주 퀸즐랜드 대학교의 엔지니어이자 사이보그 곤충에 대해 독립적으로 연구한 T. 탕 보-도안(T. Thang Vo-Doan)은 이 연구의 간단한 설정을 칭찬했다. 강화 학습은 유연하고 이를 기반으로 하는 AI는 복잡한 작업을 수행하는 방법을 알아낼 수 있다.
이 논문의 주저자인 하버드 대학교 생물물리학자 층구앙 리(Chenguang Li)에 따르면 "이것이 어떻게 더 어려운 문제로 확장될 수 있는지 쉽게 알 수 있다." 그녀의 팀은 현재 전압과 타이밍을 조정하여 인간의 파킨슨병을 치료하기 위해 전기적 심부 뇌 자극을 개선할 수 있는지 연구하고 있다. 리는 언젠가 강화 학습과 임플란트가 우리에게 새로운 기술을 제공할 수도 있다고 말한다. 인공 신경망과 실제 신경망이 결합된 것이다.