[Google의 새로운 AI는 GPT-4보다 성능이 뛰어나다] Google의 DeepMind 사업부는 고급 "추론 기능"을 갖추고 다양한 작업에서 GPT-4보다 뛰어난 성능을 발휘할 수 있는 Gemini 다중 모달 언어 모델을 발표했다.https://www.futuretimeline.net/blog/2023/12/6-google-gemini-outperform-gpt4.htm거의 정확히 1년 전, OpenAI는 놀라운 대화 및 코딩 능력을 갖춘 GPT-3.5 기반의 대규모 언어 모델(LLM)인 ChatGPT의 공개 출시를 발표했으며, 이는 인공지능(AI)의 새로운 벤치마크를 설정했다. 이는 역사상 가장 빠르게 성장하는 소비자 소프트웨어 애플리케이션이 되어 1억 명의 사용자를 확보하고 OpenAI의 가치 290억 달러에 기여했다.
처음에는 무료로 사용할 수 있는 연구 미리 보기로 출시되었지만 GPT-4를 기반으로 한 고급 버전이 2023년 3월에 출시되었다. 이 버전은 더 긴 텍스트 입력 크기, 더 미묘하고 유용한 응답, 더 나은 정확성, 향상된 안전성을 포함하여 훨씬 더 뛰어난 기능을 제공했다.
ChatGPT의 경이적인 성공은 다양한 경쟁 회사 간의 AI "군비 경쟁"을 촉발시켰다. 뒤처지지 않기 위해 Google은 Bard라는 자체 챗봇을 시도했다. 그러나 이는 오류가 발생하기 쉽고 사용자 프롬프트에 대한 응답이 부족하여 혼합적이고 부정적인 리뷰를 받았다.
그러나 Google의 DeepMind 사업부가 오늘 다양한 업계 벤치마크에서 GPT-4를 능가할 것이라고 회사가 주장하는 다중 모드 LLM 제품군인 Gemini를 출시함에 따라 Google의 명성은 이제 회복될 수 있다. 첫 번째 버전인 Gemini 1.0은 세 가지 모델 크기로 제공된다.
●Gemini Ultra – 매우 복잡한 작업을 위한 가장 크고 성능이 뛰어난 모델이다. ●Gemini Pro – 광범위한 작업에 걸쳐 확장하기 위한 최고의 모델이다. ●Gemini Nano – 온디바이스 작업을 위한 가장 효율적인 모델이다. Gemini는 기본적으로 다중 모드이며 처음부터 다양한 모드로 사전 훈련된 다음 추가 다중 모드 데이터로 미세 조정된다. 즉, 텍스트뿐만 아니라 이미지, 비디오, 오디오 등 다양한 입력 유형을 수용하고 이를 다양한 출력으로 변환할 수 있다.
예를 들어 설명하는 데 필요한 일련의 무작위 이미지를 생각해 보라. 쌍둥이자리는 이를 인식하고 실시간으로 말할 수 있다. 이미지를 코드로 변환하고, 이미지 간의 유사점을 식별하고, 이미지의 "하이브리드" 조합을 이해하고, 이미지나 클립에서 영화를 추측하고, 익숙하지 않은 환경을 이해하는 등의 작업을 수행할 수 있다. 또한 다국어성과 문화적 이해력도 갖추고 있다.
Gemini의 창의적인 기술 중 일부는 아래 비디오에서 볼 수 있다.
90%의 점수를 받은 Gemini Ultra는 57개 주제의 MMLU(대규모 다중 작업 언어 이해) 벤치마크에서 인간 전문가를 능가한 최초의 AI이다. 비교를 위해 ChatGPT의 프리미엄 버전은 86.4%를 달성할 수 있다. 인간 전문가는 89.8%로 정의된다.
"MMLU에 대한 우리의 새로운 벤치마크 접근 방식을 통해 Gemini는 추론 기능을 사용하여 어려운 질문에 답하기 전에 더 신중하게 생각할 수 있게 되었으며, 이는 단순히 첫인상을 사용하는 것보다 상당한 개선을 )가져왔다."고 Google DeepMind의 CEO이자 공동 창업자인 데미스 허사비스(Demis Hassabis는 블로그 게시물에서 이렇게 말했다. "우리가 테스트한 이미지 벤치마크를 통해 Gemini Ultra는 추가 처리를 위해 이미지에서 텍스트를 추출하는 OCR(객체 문자 인식) 시스템의 지원 없이 이전 최첨단 모델보다 성능이 뛰어났다. 이러한 벤치마크는 Gemini의 기본 다중 양식을 강조하고 Gemini의 보다 복잡한 추론 능력의 초기 징후를 나타낸다."
더 나은 수학 및 코딩 능력과 같은 기타 테스트 결과는 아래 표에 나와 있다.
Google은 안전과 보안을 보장하기 위해 노력해 왔다. "우리는 Gemini를 처음부터 책임감 있게 구축했으며 보호 장치를 통합하고 파트너와 협력하여 더욱 안전하고 포괄적인 환경을 만들었다."라고 밝혔다. "내부 평가 접근 방식의 맹점을 식별하기 위해 우리는 다양한 외부 전문가 및 파트너 그룹과 협력하여 다양한 문제에 대해 모델의 스트레스 테스트를 진행하고 있다." Gemini Pro와 Nano는 오늘부터 Bard와 다른 앱에서 무료로 사용할 수 있습니다. 8개 벤치마크 중 6개에서 Pro 버전은 GPT-3.5를 능가하여 "현재 시장에서 가장 강력한 무료 챗봇"이 되었다. 가장 큰 모델 버전인 Gemini Ultra는 "Bard Advanced"에 통합될 예정이며 2024년 초에 소프트웨어 개발자에게 제공될 예정이다. <저작권자 ⓒ ainet 무단전재 및 재배포 금지>
대규모 언어 모델(LLM), ChatGPGemini, T 관련기사목록
|
많이 본 기사
챗GPT와 AI, 로봇 많이 본 기사
최신기사
|