[GPU란 무엇인가? AI 붐을 이끄는 칩과 그 가치가 수조 달러에 달하는 이유] 최고급 GPU는 수만 달러에 팔릴 수 있으며, 선도적인 제조업체인 Nvidia는 제품에 대한 수요가 급증 하면서 시장 가치가 2조 달러를 넘어 치솟았다.:AI넷

세계가 최신 AI 기술을 활용하기 위해 서두르고 있는 가운데, 첨단 기술 하드웨어 중 하나인 그래픽 처리 장치(GPU)가 놀랍도록 인기 있는 상품이 되었다.

최고급 GPU는 수만 달러에 팔릴 수 있으며, 선도적인 제조업체인 Nvidia는 제품에 대한 수요가 급증 하면서 시장 가치가 2조 달러를 넘어 치솟았다.

GPU는 단순한 고급 AI 제품이 아닙니다. 휴대폰, 노트북, 게임 콘솔에도 GPU 성능이 떨어진다.

이제 여러분은 아마도 GPU란 과연 무엇인지 궁금할 것이다. 그리고 무엇이 그들을 그렇게 특별하게 만드는가?

GPU란 무엇인가?

GPU는 원래 비디오 게임 및 컴퓨터 지원 설계 소프트웨어 와 관련된 복잡한 3D 장면 및 개체를 빠르게 생성하고 표시하도록 설계되었다. 최신 GPU는 비디오 스트림 압축 해제 와 같은 작업도 처리한다 .

대부분의 컴퓨터의 "두뇌"는 중앙 처리 장치(CPU)라고 불리는 칩이다. CPU는 그래픽 장면을 생성하고 비디오의 압축을 푸는 데 사용할 수 있지만 일반적으로 GPU에 비해 이러한 작업에서는 훨씬 느리고 효율성이 떨어진다. CPU는 워드 프로세싱 및 웹 페이지 탐색과 같은 일반적인 계산 작업에 더 적합하다.

GPU는 CPU와 어떻게 다른가?

일반적인 최신 CPU는 8~16개의 " 코어 " 로 구성되며 각 코어는 복잡한 작업을 순차적으로 처리할 수 있다.

반면에 GPU에는 상대적으로 작은 수천 개의 코어가 있으며, 이는 모두 동시에("병렬") 작동하여 전체 처리 속도를 빠르게 달성하도록 설계되었다. 따라서 순차적으로 수행하기보다는 동시에 수행할 수 있는 다수의 간단한 작업이 필요한 작업에 적합하다.

기존 GPU에는 두 가지 주요 특징이 있다.

첫째, 대형 데스크톱 컴퓨터용 추가 카드에 흔히 포함되는 독립형 칩이 있다. 두 번째는 동일한 칩 패키지에 CPU와 결합된 GPU이다. 이는 PlayStation 5와 같은 노트북 및 게임 콘솔에서 흔히 볼 수 있습니다. 두 경우 모두 CPU가 GPU의 기능을 제어한다.

GPU가 AI에 왜 그렇게 유용한가?

GPU는 그래픽 장면을 생성하는 것 이상의 용도로 용도를 변경할 수 있는 것으로 나타났다.

심층 신경망 과 같은 인공 지능 의 기반이 되는 많은 기계 학습 기술은 다양한 형태의 행렬 곱셈에 크게 의존한다.

이것은 매우 큰 숫자 집합을 곱하고 합하는 수학적 연산이다. 이러한 작업은 병렬 처리에 적합하므로 GPU에서 매우 빠르게 수행할 수 있다.

GPU의 다음 단계는 무엇?

GPU의 숫자 처리 능력은 코어 수와 작동 속도의 증가로 인해 꾸준히 증가하고 있다. 이러한 개선은 주로 대만의 TSMC 와 같은 회사의 칩 제조 개선에 의해 주도된다 .

모든 컴퓨터 칩의 기본 구성 요소인 개별 트랜지스터의 크기가 줄어들고 있어 동일한 양의 물리적 공간에 더 많은 트랜지스터를 배치할 수 있다.

그러나 이것이 전부는 아닙니다. 기존 GPU는 AI 관련 계산 작업에 유용하지만 최적은 아니다.

GPU가 원래 그래픽에 대한 특수 처리를 제공하여 컴퓨터를 가속화하도록 설계된 것처럼 기계 학습 작업 속도를 높이도록 설계된 가속기가 있다. 이러한 가속기를 흔히 데이터센터 GPU라고 한다.

AMD 및 Nvidia와 같은 회사에서 만든 가장 인기 있는 가속기 중 일부는 전통적인 GPU로 시작되었다. 시간이 지나면서 그들의 디자인은 다양한 기계 학습 작업을 더 잘 처리할 수 있도록 발전했다. 예를 들어 보다 효율적인 " brain float " 숫자 형식을 지원하는 것이다.

Google의 텐서 처리 장치 및 Tenstorrent의 Tensix 코어 와 같은 다른 가속기는 처음부터 심층 신경망의 속도를 높이기 위해 설계되었다.

데이터 센터 GPU 및 기타 AI 가속기는 일반적으로 기존 GPU 추가 카드보다 훨씬 더 많은 메모리를 제공하며 이는 대규모 AI 모델을 훈련하는 데 중요하다. AI 모델이 클수록 더 유능하고 정확한다.

학습 속도를 더욱 높이고 ChatGPT와 같은 더 큰 AI 모델을 처리하기 위해 많은 데이터 센터 GPU를 함께 풀링하여 슈퍼컴퓨터를 구성할 수 있다. 이를 위해서는 사용 가능한 숫자 처리 능력을 적절하게 활용하기 위해 더 복잡한 소프트웨어가 필요하다. 또 다른 접근 방식은 Cerebras가 생산하는 " 웨이퍼 규모 프로세서 " 와 같은 매우 큰 단일 가속기를 만드는 것이다.

특수 칩이 미래인가?

CPU도 가만히 있지 않았습니다. AMD와 Intel의 최신 CPU에는 심층 신경망에 필요한 숫자 처리 속도를 높이는 하위 수준 명령이 내장되어 있다. 이 추가 기능은 주로 "추론" 작업, 즉 이미 다른 곳에서 개발된 AI 모델을 사용하는 데 도움이 된다.

우선 AI 모델을 훈련하려면 GPU와 같은 대형 가속기가 여전히 필요하다.

특정 기계 학습 알고리즘을 위해 더욱 전문화된 가속기를 만드는 것이 가능하다. 예를 들어, 최근 Groq라는 회사는 ChatGPT 라인을 따라 대규모 언어 모델을 실행하기 위해 특별히 설계된 " 언어 처리 장치 "(LPU)를 생산했다.

그러나 이러한 특수 프로세서를 만드는 데는 상당한 엔지니어링 리소스가 필요하다. 역사를 보면 특정 기계 학습 알고리즘의 사용량과 인기가 최고조에 달했다가 쇠퇴하는 경향이 있으므로 값비싼 전문 하드웨어가 빠르게 구식이 될 수 있다.

그러나 일반 소비자의 경우에는 문제가 되지 않는다. 당신이 사용하는 제품의 GPU와 기타 칩은 조용히 계속해서 빨라질 가능성이 높다.

이 기사는 크리에이티브 커먼즈 라이센스에 따라 The Conversation 에서 재출판되었습니다 . 원본 기사를 읽어보세요 .

이미지 크레디트: 엔비디아