광고
광고
광고
광고
광고
광고
광고
광고
광고
광고
광고
광고
광고
로고

[OPEN AI에 필적할 멀티모달 AI 모델] 일론 머스크의 AI 벤처인 xAI가 오픈AI와의 경쟁 무대에 진입하면서 최초의 멀티모달 선보임. 문서, 차트, 다이어그램, 스크린샷 및 사진을 포함한 다양한 시각적 형식을 이해할 수 있는 기능을 자랑

박세훈 | 기사입력 2024/04/22 [08:20]

[OPEN AI에 필적할 멀티모달 AI 모델] 일론 머스크의 AI 벤처인 xAI가 오픈AI와의 경쟁 무대에 진입하면서 최초의 멀티모달 선보임. 문서, 차트, 다이어그램, 스크린샷 및 사진을 포함한 다양한 시각적 형식을 이해할 수 있는 기능을 자랑

박세훈 | 입력 : 2024/04/22 [08:20]

 

OPEN AI에 필적할 멀티모달 AI 모델

 

일론 머스크(Elon Musk)의 AI 벤처인 xAI가 오픈AI와의 경쟁 무대에 진입하면서 최초의 멀티모달 모델인 그록 1.5 비전(Grok 1.5 Vision)을 선보였다. 이 최신 모델은 텍스트뿐만 아니라 문서, 차트, 다이어그램, 스크린샷 및 사진을 포함한 다양한 시각적 형식을 이해할 수 있는 기능을 자랑한다.

xAI, Grok 1.5 비전 공개: OpenAI에 필적할 멀티모달 AI 모델

인류를 혁신할 수 있는 AI의 잠재력에 대한 확고한 옹호자인 머스크는 OpenAI의 궤적에 동의하지 않은 후 작년에 xAI를 출시했다. xAI는 영향력 있는 AI 연구자들과 협력하여 투명성과 개방성을 갖춘 AI 모델을 개발한다는 사명에 착수했다. 지난해 11월 Grok의 출시는 회사의 첫 번째 단계였으며, 최근에는 기본 모델 가중치와 네트워크 아키텍처를 오픈 소스로 공개하기로 결정했다.

Grok 1.5 Vision은 물리적 영역과 디지털 영역 간의 격차를 해소하는 것을 목표로 한다. 모델의 기능은 7가지 주요 사례를 통해 소개되어 다양한 기능을 보여준다. 순서도를 Python 코드로 변환하는 것부터 칼로리 계산에 대한 영양 라벨 분석에 이르기까지 Grok 1.5 Vision은 놀라운 다재다능함을 보여준다. 아이들의 그림에서 취침 시간 이야기를 생성하고 밈 뒤에 숨겨진 유머를 해독하여 귀중한 통찰력과 실질적인 도움을 제공할 수도 있다.

또한 xAI는 멀티모달 모델의 공간 이해도를 평가하기 위해 새로운 벤치마크인 RealWorldQA를 도입했다. Grok 1.5 Vision은 이 벤치마크에서 탁월하며, 물체 인식 및 운전 조언 제공과 같은 작업에서 다른 제품을 능가한다.

앞으로 xAI는 Grok의 오디오, 음성 및 비디오 이해 능력을 향상시켜 유익한 인공 일반 지능(AGI)을 개발한다는 목표에 부합할 계획이다. 일론 머스크(Elon Musk)가 2025년까지 AI가 인간의 지능을 능가할 것으로 예상함에 따라 업계는 진화하는 AI 환경에 대한 xAI의 기여를 간절히 기다리고 있다.

Grok 1.5 Vision은 곧 회사가 선정한 사용자 그룹을 대상으로 테스트할 수 있으며, 이는 사회의 이익을 위해 AI 기술을 발전시키겠다는 xAI의 약속을 강조한다. 제조사 Impact Lab

 

 
광고
광고
광고
광고
광고
광고
많이 본 기사