광고
광고
광고
광고
광고
광고
로고

단백질 폴딩의 50년 미스터리를 AI로 해결하다. 생물학에서 가장 큰 미스터리 중 하나인 단백질 폴딩은 인공지능 회사인 DeepMind에 의해 해결되었다. AI시스템의 최신 버전인 AlphaFold가 50년 동안의 단백질 접힘 문제에 대한 해결책을 제시했다.

JM Kim | 기사입력 2020/12/02 [09:02]

단백질 폴딩의 50년 미스터리를 AI로 해결하다. 생물학에서 가장 큰 미스터리 중 하나인 단백질 폴딩은 인공지능 회사인 DeepMind에 의해 해결되었다. AI시스템의 최신 버전인 AlphaFold가 50년 동안의 단백질 접힘 문제에 대한 해결책을 제시했다.

JM Kim | 입력 : 2020/12/02 [09:02]

단백질 폴딩은 단백질 사슬이 본래의 3차원 구조를 획득하는 물리적 과정이다. 이 프로세스는 일반적으로 밀리 초에서 초의 시간 단위로 발생하지만 일부 유형은 셀 외부에서 연구할 때 몇 분 또는 몇 시간 동안 지속될 수 있다.

 

올바른 3차원 구조는 대부분의 단백질이 살아있는 유기체 내에서 기능하는 데 필수적이다. 잘못 접힌 단백질은 아미노산 서열의 돌연변이 또는 외부 요인에 의한 정상적인 접힘 과정의 중단으로 인해 발생할 수 있다. 많은 알레르기와 함께 많은 질병이 잘못 접힌 단백질의 결과로 여겨지며, 이로 인해 단백질 접힘 연구가 의학 과학자들에게 큰 관심을 끌고 있다.  

 

단백질은 하나 이상의 폴리펩티드로 구성된다. 아래 그림과 같이 이들은 최대 50개의 아미노산을 포함하는 긴 펩타이드 사슬이다. 1969년 미국 분자생물학자인 Cyrus Levinthal은 펼쳐진 폴리펩티드 사슬의 자유도가 매우 높기 때문에 분자가 천문학적으로 가능한 공간 배열을 가지고 있다고 지적했다. 그의 논문 중 하나에서 10143의 추정치가 나왔다.

 

그 이후로 단백질 폴딩을 연구하고 복잡성을 줄이고 과정에 대한 단서를 밝히기 위해 다양한 실험이 고안되었다. 이러한 방법에는 핵 자기 공명 및 X선 결정학은 물론 저온 전자현미경과 같은 최신 기술이 포함된다. 단백질 구조 예측은 생물정보학 및 이론화학에서 가장 중요한 목표 중 하나이다. 의학(: 약물 설계) 및 생명 공학 (: 새로운 효소 설계)에서 매우 중요하다.

큰 과학적 진보로 런던에 본사를 둔 회사인 DeepMind는 오늘 자사 AI시스템의 최신 버전인 AlphaFold 50년 동안의 "단백질 접힘 문제"에 대한 해결책을 제시했다고 발표했다.

 

DeepMind의 팀은 1994년부터 전 세계 과학계에서 2년마다 테스트 한 실험인 CASP(단백질 구조 예측의 중요 평가)를 사용했다. 참가자는 최근에 발견된 단백질의 구조를 "맹목적으로"예측해야 하며, 이러한 예측은 나중에 이용 가능해지면 실제 실험 데이터와 비교된다.

CASP가 예측의 정확도를 측정하는 주요 측정 항목은 0-100범위의 GDT (Global Distance Test)이다. 간단히 말해서 GDT는 올바른 위치에서 임계거리 내에 있는 아미노산 잔기(단백질 사슬의 구성 요소)의 백분율이다. 90 GDT의 점수는 일반적으로 실험 방법에서 얻은 결과와 경쟁하는 것으로 간주된다.

 

11/30일날 발표된 최신 결과에 따르면 AlphaFold AI는 모든 대상에서 중앙값 92.4 GDT를 달성했다. 평균 오차 한계는 원자의 폭(1.6 옹스트롬 또는 0.16 나노 미터)과 비슷하다.

 

노벨상 수상자이자 왕립학회 회장 Venki Ramakrishnan 교수는 "이 계산 작업은 단백질 접힘 문제에 대한 놀라운 발전을 나타낸다. 50년 동안 생물학 분야에서 큰 도전이었다."고 말했다. "현장의 많은 사람들이 예측하기 수십 년 전에 발생했다. 생물학적 연구를 근본적으로 변화시킬 다양한 방법을 보는 것은 흥미로울 것이다."

 

Calico의 설립자 겸 CEO Arthur D. Levinson 박사는 "AlphaFold는 한 세대에 한 번의 발전으로 놀라운 속도와 정밀도로 단백질 구조를 예측한다. "이번 도약은 생물학 연구를 혁신하고 약물 발견 과정을 가속화할 수 있는 많은 가능성을 지닌 컴퓨터 방법이 어떻게 준비되어 있는지 보여준다."

 

DeepMind 팀은 알 수 없는 구조의 단백질 서열을 포함하는 대규모 데이터베이스와 함께 Protein Data Bank 170,000단백질 구조에 대한 AI를 훈련했다. 하드웨어의 경우 몇 주 동안 100~200개의 GPU (그래픽 처리 장치)에 해당하는 128개의 Tensor 처리 장치를 사용했다. 팀은 "머신러닝에 사용되는 가장 큰 최신 모델의 맥락에서 비교적 적은 양의 컴퓨팅"이라고 말한다.

 

새로운 시스템은 아미노산 잔기가 "노드"이고 가장자리가 잔기를 근접하게 연결하는 "공간 그래프"의 구조를 해석하려는 "주의 기반 신경망"으로 설명된다. 반복적인 프로세스를 통해 단백질의 기본 물리적 구조에 대한 강력한 예측을 개발하여 실험실 벤치에서 수년이 걸리는 작업을 며칠 만에 수행한다. 또한 단백질의 여러 영역의 신뢰성에 대한 추정치를 제공한다. DeepMind의 탁월한 정확도 덕분에 올해 CASP에서 경쟁하는 100개 이상의 다른 팀을 이길 수 있었다.

 

"나는 이것이 단백질 구조 예측 분야에 매우 지장을 줄 것이라고 말하는 것이 공정하다고 생각한다"고 뉴욕 시 컬럼비아대학의 컴퓨터 생물 학자이자 CASP 참가자인 Mohammed AlQuraishi는 말했다. "핵심 문제가 해결되었기 때문에 많은 사람들이 현장을 떠날 것이라고 생각한다. 이것은 첫 번째 질서의 돌파구이며 확실히 내 생애에서 가장 중요한 과학적 결과 중 하나이다."

 

연구원들은 현재 피어 리뷰 저널에 게재할 논문을 작성하고 있다. 또한 그들은 과학계에 보다 폭넓게 접근할 수 있도록 보다 확장 가능한 방식으로 시스템을 개발할 계획이다. AlphaFold는 예를 들어 치료가 더 빨리 도착할 수 있도록 함으로써 향후 유행성 대응 노력에 유용할 수 있다.

 

"알려진 질병에 대한 이해를 가속화할 뿐만 아니라, 우리는 현재 우리가 모델을 가지고 있지 않은 수억 개의 단백질, 즉 알려지지 않은 생물학의 광대 한 지형을 탐구할 수 있는 이러한 기술의 잠재력에 대해 기대하고 있다."고 팀은 말한다. "결정되지 않은 단백질 중에는 새롭고 흥미로운 기능을 가진 일부가 있을 수 있으며 망원경이 알려지지 않은 우주를 더 깊이 볼 수 있도록 도와주는 것처럼 AlphaFold와 같은 기술이 우리가 단백질을 찾는 데 도움이 될 수 있다."

 

 
단백질 폴딩, DeepMind, AI, AlphaFold 관련기사목록
광고
광고
광고
광고
광고
많이 본 기사
신기술/산업·미래교육 미래예측 많이 본 기사