광고
광고
광고
광고
광고
광고
광고
광고
광고
광고
광고
광고
광고
광고

AI넷

[또 다른 중국 AI 회사는 OpenAI를 이겼다고 말한다] 딥시크(DeepSeek)보다 훨씬 더 많은 자원을 보유하고 있는 알리바바(Alibaba)가 시장에 더 큰 충격파를 던지고 있다. 알리바바의 주가는 발표 후 2% 가까이 급등했다.

박세훈 | 기사입력 2025/02/01 [00:03]

[또 다른 중국 AI 회사는 OpenAI를 이겼다고 말한다] 딥시크(DeepSeek)보다 훨씬 더 많은 자원을 보유하고 있는 알리바바(Alibaba)가 시장에 더 큰 충격파를 던지고 있다. 알리바바의 주가는 발표 후 2% 가까이 급등했다.

박세훈 | 입력 : 2025/02/01 [00:03]

 

또 다른 중국 AI 회사는 OpenAI를 이겼다고 말한다

 

중국의 주요 기술 기업인 알리바바(Alibaba)는 자사의 Qwen AI 모델의 최신 버전이 이번 주 초 OpenAI를 제치고 실리콘 밸리를 뒤집어 놓은 모델인 DeepSeek의 V3를 능가했다고 주장한다.

 

알리바바는 중국 소셜미디어 플랫폼인 위챗(WeChat)에 올린 성명에서 자사의 Qwen 2.5-Max가 "권위 있는 주류 벤치마크에서 세계 최고의 모델 성능을 보여줬다"며 OpenAI의 GPT-4o, Anthropic의 Claude 3.5 Sonnet, Meta의 Llama 3.1을 "종합적으로 능가한다"고 밝혔다.

이 주장이 사실로 확인될 경우, 서구 기술 시장을 혼란에 빠뜨린 중국 경쟁사들 사이에서 더 높은 성능과 더 비용 효율적인 AI 모델을 개발하기 위한 경쟁이 또 다시 격화될 수 있다.

이 소식은 알리바바의 본거지인 항저우에 설립된 딥시크(DeepSeek)가 아주 적은 비용으로 오픈AI의 최첨단 모델과 비슷하거나 더 나은 성능을 달성하는 방법을 알아냈다고 주장한 후에 나온 것이다. 이 발표는 대규모 쟁탈전으로 이어졌고, 과거 AI 선두 주자들의 시가총액이 1조 달러가 넘었다.

이제 딥시크(DeepSeek)보다 훨씬 더 많은 자원을 보유하고 있는 알리바바(Alibaba)가 시장에 더 큰 충격파를 던지고 있다. 알리바바의 주가는 발표 후 2% 가까이 급등했다.

이와 함께 AI 칩 제조업체인 엔비디아(Nvidia)도 수요일 아침에 약 5% 하락했지만, 알리바바의 발표에 대한 반응인지, 고급 GPU 부족에 대한 반응인지, 아니면 이 둘의 혼합인지는 불분명하다. 엔비디아는 이미 역사상 가장 큰 하루 손실이라는 새로운 기록을 세우며 상처를 느끼고 있었다.

로이터가 지적했듯이 알리바바와 딥시크만이 아니다. 중국에 본사를 둔 틱톡 소유주인 바이트댄스(ByteDance)도 지난주 특정 벤치마크에서 OpenAI의 o1 AI 모델을 능가하는 것으로 알려진 플래그십 AI 모델의 새 버전을 선보였다.

블룸버그의 보도에 따르면, 유니콘 밸류에이션을 가진 약 6개의 다른 중국 AI 스타트업이 날개를 달고 기다리고 있으며, 이는 미국에 기반을 둔 기업들이 경쟁을 벌이면서 가격 전쟁이 임박했음을 암시한다. (Futurism)

 

말 그대로 30달러에 DeepSeek가 OpenAI를 이겼다고 한다

 

비디오 게임 Doom을 출시한 하드웨어 전문가에 대해 들어보셨을 거다.  AI 괴짜에 해당하는 것은 DeepSeek의 윙윙 거리는 기술을 비용으로 재현하는 방법을 알아 냈다.

Getty / Futurism

캘리포니아 대학교 버클리 캠퍼스(University of California, Berkeley)의 박사 과정 학생인 지아이 판(Jiayi Pan)은 자신과 그의 AI 연구팀이 딥시크(DeepSeek)의 R1-Zero의 핵심 기능을 단 30달러로 재창조했다고 주장한다. 이번 주에는 훈련하는 데 수백만 달러에 불과하다고 말하는 매우 절약한 모델로 제공된다.

다른 전문가들이 무게를 잰 후 직접 테스트할 때까지 소금 한 알과 함께 복용하자. 그러나 이러한 주장, 특히 저렴한 가격표는 AI 연구의 담론이 거대한 데이터센터로 구동되는 초집약적 컴퓨팅의 패러다임에서 다음을 호출하는 효율적인 솔루션으로 빠르게 전환되고 있음을 보여주는 또 다른 예이다. 재무 모델(financial model) OpenAI와 같은 주요 업체에 의문이 제기된다. 발표하는 게시물에서 연구팀의 조사 결과 X-former Twitter에서 Pan은 연구원들이 모델을 다음과 같이 훈련시켰다고 말했다. 카운트다운 게임, 플레이어가 미리 결정된 답에 도달하기 위해 숫자 집합에서 방정식을 만드는 숫자 연산 연습이다.

Pan은 소규모 언어 모델은 "더미 출력"으로 시작하지만 팀의 강화 훈련을 통해 해결책을 찾기 위해 "점차적으로 수정 및 검색과 같은 전술을 개발"한다고 말했다.

 

"결과: 정말 효과가 있습니다!" 판이 말했다.

Pan의 팀은 현재 논문을 제작하기 위해 노력하고 있지만 "TinyZero"라는 소중한 이름을 가진 그들의 모델은 다음에서 사용할 수 있다. 

"우리는 이 프로젝트가 새로운 RL 스케일링 연구를 이해하기 쉽게 하고 더 쉽게 접근할 수 있도록 하는 데 도움이 되기를 바랍니다." Pan은 썼다.

R1-Zero는 30억 개의 매개변수를 가진 작은 언어 모델이지만 헤비급 형제인 R1과 비교해 보자. 이 팀의 성과는 작업 중인 오픈 소스 개발자들에게 새로운 소식이 될 수 있다. 

DeepSeek의 R1 모델 출시에는 다음이 있다. 1조 달러 규모의 폭락 메타(Meta), 구글(Google), 오픈AI(OpenAI), 마이크로소프트(Microsoft) 등이 주도하는 하늘을 찌르는 인공 지능 벤처 기업들이 미국 AI와 관련된 주식의 나사를 조였다.. 항저우에 본사를 둔 오픈소스 AI 스타트업 주장 그 기술이 기업 벤처가 불태운 것을 정확히 할 수 있다는 것이다. 수십억 달러 적은 비용으로 할 수 있다.

이로 인해 투자자들로부터 많은 질문이 쏟아져 나왔고, 그 이유는 다음과 같다. 지구상의 기술 기업들은 모두 함께 걸어 들어간다.  그리고 TinyZero와 같은 모델을 30달러 미만과 단 며칠의 작업으로 재현할 수 있다면 거대 기술 대기업이 필요로 하는 것은 무엇일까? 5,000억 달러 규모의 AI 인프라 때문에? (Futurism)

 

전 인텔 CEO는 DeepSeek을 본 후 OpenAI는 끝냈다고 말한다

 

중국 인공지능(AI) 기업 딥시크(DeepSeek)의 성공 소식이 서구 전역에 파문을 일으키고 있다. 엔비디아의 주식 밸류에이션에 타격을 입혔다그리고 트럼프 대통령을 당황하게 했다.

Drew Angerer / Odd Andersen / AFP via Getty / Futurism

 

이제 미국의 스타트업 구루들조차 뛰어들기 시작했다. 기술 초강대국 인텔의 전 CEO인 팻 겔싱어(Pat Gelsinger)는 딥시크(DeepSeek)의 기술을 본 후 농담이 아닌 글루(Gloo)라고 불리는 그의 새로운 교회 스타트업이 사내 모델을 위해 OpenAI의 기술을 포기하고 있다고 말한다.

"제 글루 엔지니어들은 현재 [DeepSeek의] R1을 실행하고 있습니다." 겔싱어는 말했다. "그들은 [OpenAI]의 o1을 실행할 수 있었습니다 — 글쎄요, 그들은 API를 통해서만 o1에 액세스할 수 있습니다."

겔싱어 — 지난해 칩 제조업체의 재정적 어려움이 심화되자 DeepSeek가 유사한 모델 개발 비용을 낮추어 업계 진입 장벽을 낮출 것이라는 기대에 부응했다.

그리고 경건한 CEO는 혼자가 아니다. DeepSeek의 OpenAI, Anthropic 및 Google에 비해 성능이 저렴하다. 심지어 트럼프조차도 일정량의 까마귀를 먹는다고 인정하면서 DeepSeek를 "모닝콜" 하원 공화당 회의에서.

새로 취임한 트럼프 대통령은 더 나아가 딥시크의 칭찬을 아끼지 않았으며, 미국 기업들이 천문학적 비용을 줄이기 위해 이 모델을 활용할 수 있다면 R1 모델이 "매우 긍정적인 발전"이 될 수 있다고 인정했다.

 

하지만 모든 사람이 트럼프만큼 중국 기술에 열광하는 것은 아니다.

몇 며칠 동안 침묵 속에 우울해한 후 OpenAI CEO Sam Altman은 "우리는 분명히 훨씬 더 나은 모델을 제공할 것이고 새로운 경쟁자를 갖는 것은 정당하게 활력을 불어넣습니다!"

지금은 우파 성향의 마크 저커버그 메타 최고경영자(CEO)는 보도에 따르면 여러 명의 '워룸(war rooms)'에 해당하는 엔지니어들을 모아 회사 자체의 목적을 위해 중국 소프트웨어를 분리하고 있는 것으로 알려졌다.

한편 일론 머스크는 알트먼을 맹비난하는 것에서 잠시 휴식을 취했다. 스케일 AI CEO 알렉산드르 왕 DeepSeek가 H100 그래픽 카드가 20,000개밖에 없다고 거짓말을 하고 있다는 주장이며, 이는 두 CEO 모두 증거를 뒷받침하지 않았다는 것이다.

"제가 알기로는 DeepSeek가 약 50,000대의 H100을 보유하고 있는 것으로 알고 있습니다. Wang은 다음과 같이 주장했다. 에 CNBC 방송"미국이 시행한 수출 통제에 위배되기 때문"이라고 말했다.

그는 "'프로 아메리카' 기술자들은 미국의 주요 프론티어 모델로부터 훈련된 중국 모델을 공개적으로 지지하고 있다"며 "수출 통제를 위반할 가능성이 있는 칩을 가지고 있으며, 자신들의 서비스 약관에 따라 미국 고객 데이터를 중국으로 가져가고 있다"고 꼬집었다. (DeepSeek는 회사의 앱이 아닌 로컬 하드웨어에서 실행할 수 있다. 대부분의 미국 회사는 사용자에게 절대 제공하지 않는 선택 사항이다.)

막연한 외국인 혐오 비난은 제쳐두고, 온라인에서 아무리 야옹거리도 DeepSeek가 게임을 뒤흔들었다는 사실을 바꿀 수 없다. 이제 미국 기술 부문은 왜 그들이 인류 역사상 가장 호화로운 인프라 투자를 받을 자격이 있는지 입증해야 할 책임이 있다. (Futurism)

 

 

 

 
광고
광고
광고
광고
광고
광고
많이 본 기사