시작페이지로　l　즐겨찾기　l　RSS　l　편집 2024.04.27 [10:36]

세상을 바꾸자
AI바이오제약 수명연장
자율차,드론, 교통, 에너지,기후
유투브
신기술&메타버스AR/VR
AiMindbot과 미래 우주
챗GPT와 AI, 로봇
라이프,거버넌스, 조직, 유망직종

AI바이오제약 수명연장

[인공지능] OpenAI의 새로운 AI는 70,000시간 동안 유튜브를 시청하여 온라인 게임인 마인크래프트를 플레이하는 방법을 배웠다. 인공지능은 미세 조정으로 더 집중된 데이터 세트로 모델을 훈련하며 강화 학습을 통해 추가로 미세 조정한 후 다이아몬드 곡괭이를 만드는 방법을 배웠다. 이 기술은 인간 플레이어가 달성하는 데 약 20분과 24,000번의 행동이 필요하다.

https://singularityhub.com/2022/06/26/openais-new-ai-learned-to-play-minecraft-by-watching-70000-hours-of-youtube/

JM Kim | 기사입력 2022/06/28 [00:00]

AI바이오제약 수명연장

[인공지능] OpenAI의 새로운 AI는 70,000시간 동안 유튜브를 시청하여 온라인 게임인 마인크래프트를 플레이하는 방법을 배웠다. 인공지능은 미세 조정으로 더 집중된 데이터 세트로 모델을 훈련하며 강화 학습을 통해 추가로 미세 조정한 후 다이아몬드 곡괭이를 만드는 방법을 배웠다. 이 기술은 인간 플레이어가 달성하는 데 약 20분과 24,000번의 행동이 필요하다.

https://singularityhub.com/2022/06/26/openais-new-ai-learned-to-play-minecraft-by-watching-70000-hours-of-youtube/

JM Kim

| 입력 : 2022/06/28 [00:00]

2020년, OpenAI의 머신러닝 알고리즘 GPT-3은 인터넷에서 스크랩한 수십억 개의 단어를 섭취한 후 잘 만들어진 문장을 뱉어내기 시작했을 때 사람들을 놀라게 했다. 올해 텍스트와 이미지에 대해 훈련을 받은 GPT-3의 사촌인 DALL-E 2는 말을 타고 있는 우주비행사의 초현실적인 이미지를 만들기 시작하면서 온라인에서 비슷한 반향을 일으켰고, 최근에는 그렇지 않은 사람들의 이상하고 사실적인 얼굴을 만들기 시작했다. 존재하지 않는다.

이제 회사는 최신 AI가 유튜브에서 사람들이 게임을 하는 것을 보여주는 약 70,000시간의 비디오를 본 후 마인크래프트를 플레이하는 법을 배웠다고 말한다.

광산 학교

훨씬 단순한 "샌드박스" 버전의 게임에서 작동하는 수많은 이전 마인크래프트 알고리즘과 비교할 때 새로운 AI는 표준 키보드 및 마우스 명령을 사용하여 인간과 동일한 환경에서 재생된다.

작업을 자세히 설명하는 블로그 게시물과 사전 인쇄에서 OpenAI 팀은 알고리즘이 기본적으로 나무 베기, 판자 만들기, 테이블 만들기와 같은 기본 기술을 배웠다고 말한다. 그들은 또한 그것이 수영, 사냥, 요리 및 "기둥 점프"를 관찰했다.

"우리가 아는 한, 끌어서 놓기 인벤토리 관리 및 항목 제작을 포함하여 수정되지 않은 완전한 인간 작업 공간에서 작동하는 출판된 작업은 없다."라고 저자는 논문에서 썼다.

미세 조정으로 즉, 더 집중된 데이터 세트로 모델을 훈련하는 것이다. 그들은 알고리즘이 이러한 모든 작업을 보다 안정적으로 수행한다는 것을 발견했지만, 또한 나무와 석기 도구를 제작하고 기본 쉼터를 만들고, 마을을 탐험하고, 상자를 습격함으로써 기술 능력을 향상시키기 시작했다.

강화 학습을 통해 추가로 미세 조정한 후 다이아몬드 곡괭이를 만드는 방법을 배웠다. 이 기술은 인간 플레이어가 달성하는 데 약 20분과 24,000번의 행동이 필요하다.

이것은 주목할 만한 결과이다. AI는 마인크래프트의 광범위한 게임 플레이로 오랫동안 어려움을 겪었다. 인공지능이 이미 숙달한 체스나 바둑 같은 게임은 목표가 뚜렷하고 그 목표를 향한 진척도를 측정할 수 있다. 바둑을 정복하기 위해 연구원들은 알고리즘에 목표가 주어지고 그 목표를 향한 진전에 대해 보상을 받는 강화 학습을 사용했다. 반면에 마인크래프트는 가능한 목표의 수에 제한이 없고 진행이 덜 선형적이며 심층 강화 학습 알고리즘은 일반적으로 바퀴를 돌고 있다.

예를 들어 AI 개발자를 위한 2019 MineRL 마인크래프트 대회에서 660개의 제출 중 어느 것도 대회의 비교적 단순한 목표인 다이아몬드 채굴 목표를 달성하지 못했다.

창의성에 대한 보상과 문제에 컴퓨팅 성능을 던지는 것이 항상 정답은 아니라는 점을 보여주기 위해 MineRL 주최자는 참가자에게 엄격한 제한을 두었다. 참가자에게는 NVIDIA GPU 1개와 1,000시간의 게임 플레이 기록이 허용되었다. 참가자들이 훌륭하게 수행했지만 더 많은 데이터와 720개의 NVIDIA GPU로 달성한 OpenAI 결과는 컴퓨팅 성능에 여전히 이점이 있음을 보여주는 것 같다.

AI가 교묘해진다

마인크래프트용 비디오사전훈련(VPT) 알고리즘을 통해 OpenAI는 GPT-3 및 DALL-E와 함께 사용되는 접근 방식으로 되돌아갔다. 즉, 인간이 만든 콘텐츠의 거대한 데이터 세트에 대한 알고리즘 사전 훈련이다. 그러나 알고리즘의 성공은 컴퓨팅 성능이나 데이터만으로는 가능하지 않았다. 이전에는 많은 비디오로 마인크래프트 AI를 훈련하는 것이 실용적이지 않았다.

원시 비디오 푸티지는 GPT-3 및 DALL-E와 같은 콘텐츠 생성기만큼 행동 AI에 유용하지 않다. 사람들이 무엇을 하는지 보여주지만 그들이 어떻게 하는지는 설명하지 않는다. 비디오를 작업에 연결하는 알고리즘에는 레이블이 필요하다. 예를 들어 플레이어의 개체 컬렉션을 보여주는 비디오 프레임은 인벤토리를 여는 데 사용되는 명령 키 "E"와 함께 "인벤토리"라는 레이블이 지정되어야 한다.

70,000시간 분량의 비디오에서 모든 프레임에 레이블을 지정하는 것은... 미친 짓이 될 것이다. 따라서 팀은 기본 마인크래프트 기술을 기록하고 레이블을 지정하기 위해 Upwork 계약자에게 비용을 지불했다. 그들은 이 비디오 중 2,000시간을 사용하여 두 번째 알고리즘에 마인크래프트 비디오에 레이블을 지정하는 방법을 가르쳤고 해당 알고리즘인 IDM은 70,000시간 분량의 유튜브 영상에 주석을 달았다. (팀은 키보드 및 마우스 명령에 레이블을 지정할 때 IDM이 90% 이상 정확했다고 말한다.)

온라인에서 행동 데이터 세트의 잠금을 해제하기 위해 데이터 레이블링 알고리즘을 훈련하는 인간의 이러한 접근 방식은 AI가 다른 기술도 배우는 데 도움이 될 수 있다. 연구원은 "VPT는 에이전트가 인터넷에서 방대한 수의 비디오를 보고 행동하는 법을 배울 수 있도록 하는 길을 열어준다."라고 썼다. 마인크래프트 외에도 OpenAI는 VPT가 프롬프트에서 컴퓨터를 작동하는 알고리즘과 같은 새로운 실제 응용 프로그램을 가져올 수 있다고 생각한다(예: 랩톱에서 문서를 찾아 상사에게 이메일로 보내달라고 요청한다고 상상해 보라).

다이아몬드는 영원하지 않다

아마도 MineRL 대회 주최측의 안타까운 일이지만, 결과는 컴퓨팅 성능과 리소스가 여전히 가장 진보된 AI의 바늘을 움직이고 있음을 보여주는 것 같다.

컴퓨팅 비용은 신경쓰지 말라. OpenAI는 Upwork 계약업체에만 160,000달러가 든다고 말했다. 공정하기는 하지만 전체 데이터 세트에 수동으로 레이블을 지정하는 것은 수백만 달러에 이르렀고 완료하는 데 상당한 시간이 걸렸을 것이다. 컴퓨팅 성능이 무시할 수 없는 수준은 아니었지만 실제로는 모델이 상당히 작았다. VPT의 수억 개의 매개변수는 GPT-3의 수천억 개보다 훨씬 적다.

그래도 데이터와 컴퓨팅을 덜 사용하는 영리한 새로운 접근 방식을 찾으려는 노력은 유효하다. 어린이는 한두 개의 비디오를 보고 마인크래프트 기본 사항을 배울 수 있다. 오늘날의 AI는 간단한 기술을 배우기 위해 훨씬 더 많은 것을 필요로 한다. AI를 더 효율적으로 만드는 것은 크고 가치 있는 과제이다.

어쨌든 이번에는 OpenAI가 공유 분위기다. 연구원들은 VPT에 위험이 없다고 말한다. 오용을 부분적으로 제한하기 위해 GPT-3 및 DALL-E와 같은 알고리즘에 대한 액세스를 엄격하게 제어했지만 현재로서는 위험이 최소화된다. 그들은 데이터, 환경 및 알고리즘을 오픈 소스로 제공했으며 MineRL과 파트너 관계를 맺고 있다. 올해의 참가자는 최신 마인크래프트 AI를 무료로 사용, 수정 및 미세 조정할 수 있다.

이번에는 다이아몬드 채굴을 훨씬 능가할 가능성이 높다.

이미지 출처: SIMON LEE / Unsplash

JM Kim의 다른기사보기

인공지능, 머신러닝, 마인크래프트, 강화학습 관련기사목록

[세계미래보고서]시리즈, 판매제품

신간소개 [세계미래보고서2024-2034] 이르면 10년 안에 등장할 인공일반지능 신기술이 가져올 유토피아와 디스토피아를 미리 살펴보자!

많이 본 기사

[소멸직종 15] 소멸직종 15가지 2030년 여행사와 직원, 캐시어 점원, 패스트푸드 요리사, 우체부, 은행원, 섬유 노동자, 인쇄소, 보석상, 배달원, 텔레마케터, 어민, 법무비서관, 조립제작사,

[Beyond Enterprizes/Actioneer.AI] 이 회사는 전통적인 전략 자문 회사의 한계를 달성하고 실행하며 극복하기 위해 고안되었다. 기업과 협력하여 그들이 직면한 기술 및 비즈니스 과제에 대한 솔루션을 찾아내고, 새로운 비즈니스 벤처를 시작한 수십 년간의 경험을 바탕으로 지침을 제공한다.

[AI 전투기 조종사와 인간 조종사의 세기의 대결] 처음으로 AI 전투기 조종사가 공중에서 실제 제트기를 이용한 공중전에서 인간 조종사와 대결했다. 이는 자율 비행 및 군사 자동화 분야에서 큰 이정표를 세웠다.

[OPEN AI에 필적할 멀티모달 AI 모델] 일론 머스크의 AI 벤처인 xAI가 오픈AI와의 경쟁 무대에 진입하면서 최초의 멀티모달 선보임. 문서, 차트, 다이어그램, 스크린샷 및 사진을 포함한 다양한 시각적 형식을 이해할 수 있는 기능을 자랑

유투브[AI가 일본의 인구 문제를 해결할 수 있을까? ] 일본의 노동력 위기 대응: AI 도입으로 미래를 준비하다. 정부의 AI 활용 확대.

[획기적인 메타물질을 개척] 식물의 놀라운 회복력에서 영감을 얻은 호주 과학자들은 레이저와 금속 분말을 활용하여 전례 없는 중량 대비 강도 비율을 달성하는 획기적인 메타물질

유투브 책[2023년에 얼마나 많은 사람들이 YouTube를 사용하나 각종 통계들] 2006년 20억으로 구글이 사들인 유투브는 2005년 2월 14일에 설립, 첫비디오는 4월 23일에 게시, 지금은 20억명이 넘는 사용자보유, 인터넷사용자 43%가 매일 유투브를 본다.

[인공지능, 에너지 괴물로 변할 위험?] 인공지능의 높은 에너지 소비: 지속 가능성에 대한 새로운 우려 Arm의 CEO가 인공지능(AI)의 과도한 에너지 소비가 지속 가능하지 않다고 경고하면서, 인공지능 기술의 환경적 영향에 대한 우려가 새롭게 부각되고 있다.

유투브[배우의 소멸? 할리우드, 배우들의 AI 복제 시작] CAA와 AI: 헐리우드의 미래와 배우의 디지털 복제. 배우의 AI 복제본 제작 파트너십 체결: 헐리우드 미래를 바꿀까?

AI바이오제약 수명연장 많이 본 기사

[노화역전, 주사 한방에 젊어진다.] 스탠포드 과학자들은 나이든 쥐에게 더 젊게 작용하는 면역체계를 제공하는 일회성 항체 치료법을 개발했으며, 이것이 사람에게도 효과가 있을 것으로 생각하고 있다. 이 하나의 항체가 노인들이 건강을 유지하는 열쇠가 될 수 있다.

[RF(저전력 무선주파수) AI 기반 인간 활동 모니터링의 발전] 인공 지능(AI)에 의해 추진되는 머신 비전은 이미지를 해석하는 능력에 혁명을 일으켜 자율 주행에서 의료 진단에 이르기까지 다양한 작업을 용이하게

[유전자 길이의 역할 해명] 노스웨스턴 메디슨(Northwestern Medicine)의 과학자들은 노화의 근본적인 메커니즘을 밝히는 획기적인 발견. 유전학 동향(Trends in Genetics)에 발표된 그들의 연구는 유전자 길이가 노화 과정의 중추적인 요인임을 확인

[획기적인 CAR T세포 치료로 교모세포종 치료에 대한 가능성 보여] 공격적인 교모세포종 암 진단을 받은 72세 남성의 최근 뇌 스캔 결과, 획기적인 새로운 치료법을 받은 지 며칠 만에 종양 크기가 눈에 띄게 감소한 것으로 나타났다.

[BCI, 뇌-컴퓨터 인터페이스]BCI를 통해 환자는 자신의 생각만으로 게임을 즐길 수 있다. 이는 운동 장애 환자를 위한 보다 빠른 치료를 제공할 수 있다. 임상 환경에서 이 기술은 길고 지루한 교정 과정을 수행하기 위해 전문 팀이 필요하지 않다.

최신기사

신간소개 [세계미래보고서2024-2034] 이르면 10년 안에 등장할 인공일반지능 신기술이 가져올 유토피아와 디스토피아를 미리 살펴보자!

[스위스가 글로벌 인재 허브로 자리매김할 수 있었던 비결] 두 개의 글로벌 보고서인 2023 글로벌 인재 경쟁력 지수(Global Talent Competitiveness Index 2023) 와 IMD 세계 인재 순위(World Talent Ranking) 에서 다시 1위를 차지했다 . 또한 최근 UN 인간개발보고서 에서 삶의 질 부문 1위를 차지했으며, 세계지적재산권기구(WIPO) 의 2023년 혁신 부문에서는 13년 연속 1위를 유지했다.

[WEF, 여성들은 직장에서 생성 AI에 뒤처지고 있다. 변경하는 방법?] 가장 어린 근로자 사이에서 격차가 가장 크다는 것이다. 18~24세 남성의 71%가 매주 생성 AI를 사용한다고 답한 반면 여성은 59%이다.

[VISA-1은 사진 한 장과 오디오 트랙 한 장으로 사람을 딥페이크한다] Microsoft Research Asia는 단일 사진과 기존 오디오 트랙에서 사람이 말하거나 노래하는 동기화된 애니메이션 비디오를 생성할 수 있는 AI 모델인 VASA-1을 공개

회원약관 ㅣ 개인정보취급방침 ㅣ 회사소개 ㅣ 청소년보호정책 ㅣ 직원게시판 ㅣ 기사제보 ㅣ 보도자료 ㅣ 기사검색

AI넷ㅣ 주소 : 우)02821 서울특별시 성북구 북악산로 1길 31 ㅣ 전화 : 02-313-6300 ㅣ 팩스 : 02-908-9494
등록번호 : 서울, 아02236ㅣ 등록일 : 2009.11. 19. ㅣ E-mail : unfutures@gmail.com, futures2055@gmail.com
회사명 : AI넷 ㅣ 발행/편집인 : 박영숙ㅣ 발행일: 2020.09.05｜청소년보호책임자 : 박영숙
사업자등록번호 : 209-15-39241 (사)유엔미래포럼 www.unfuture.org
Copyright ⓒ 2020 AI넷. All rights reserved. (This is a non-profit organization/a free newspaper.)