광고
광고
광고
광고
광고
광고
광고
광고
광고
광고
광고
광고
광고
로고

[인공지능 단백질 설계] 워싱턴 대학의 연구팀은 인공지능의 상상력을 활용하여 단백질 기능 부위의 일반적인 영역을 예측한 다음 구조를 더 조각하는 알고리즘을 설계했다. 단백질 설계 AI는 인간이 꿈꿀 수 없는 의약품의 문을 열어준다.

https://singularityhub.com/2022/07/26/protein-designing-ai-opens-door-to-medicines-humans-couldnt-dream-up/

JM Kim | 기사입력 2022/07/28 [00:00]

[인공지능 단백질 설계] 워싱턴 대학의 연구팀은 인공지능의 상상력을 활용하여 단백질 기능 부위의 일반적인 영역을 예측한 다음 구조를 더 조각하는 알고리즘을 설계했다. 단백질 설계 AI는 인간이 꿈꿀 수 없는 의약품의 문을 열어준다.

https://singularityhub.com/2022/07/26/protein-designing-ai-opens-door-to-medicines-humans-couldnt-dream-up/

JM Kim | 입력 : 2022/07/28 [00:00]

단백질을 디자인하는 것은 캐비닛을 만드는 것과 비슷하다. 첫 번째 단계는 단백질을 함께 유지하는 백본을 구축하는 것이다. 그러나 어려운 부분이 있다. 비계에 경첩을 설치할 위치를 파악하는 것, 즉 최고의 "핫스팟"을 찾아 궁극적으로 캐비닛을 완벽하게 작동시키는 문, 선반 및 기타 부착물을 놓을 위치를 찾는 것이다.

 

어떤 면에서, 단백질은 또한 그들의 구조에 내장된 핫스팟을 가지고 있다. "기능적 부위"라는 이름에 걸맞게 이 흥미로운 구석은 다른 단백질이나 약물이 붙잡을 수 있는 복잡한 부두를 형성한다. 사이트는 우리의 기본적인 생물학적 과정의 대부분을 수행하는 중심이다. 그들은 또한 새로운 치료법과 의약품을 설계하기 위한 거대한 금광이기도 하다.

 

문제는 기능적인 사이트는 매핑하기 어렵다. 과학자들은 전통적으로 정확한 결합 지점을 파악하기 위해 단백질의 의심되는 영역을 하나씩 돌연변이(한 아미노산을 다른 아미노산으로 전환)해야 했다. 탐정이 수백 명의 용의자를 선별하는 것처럼, 그 중 많은 수가 있을 수 있기 때문에 매우 지루하다.

 

Science의 새로운 연구는 전체 게임북을 뒤집었다. 워싱턴 대학(University of Washington)의 데이비드 베이커(David Baker) 박사가 이끄는 팀은 AI "상상력"을 활용하여 무수히 많은 기능적 사이트를 처음부터 꿈꾸었다. 그것은 최고의 기계 마인드의 "창의력"이다. , 단백질 기능 부위의 일반적인 영역을 예측한 다음 구조를 더 조각하는 딥 러닝 알고리즘이다.

 

현실을 확인하기 위해 팀은 새로운 소프트웨어를 사용하여 암과 싸우는 약물을 생성하고 때로는 치명적일지라도 일반적인 바이러스에 대한 백신을 설계했다. 한 사례에서 디지털 마인드는 격리된 세포에서 테스트했을 때 일반적인 바이러스에 대한 기존 항체와 완벽하게 일치하는 솔루션을 생각해 냈다. , 알고리즘은 바이러스 단백질의 핫스팟을 "상상"하여 새로운 치료법을 설계하는 표적으로 취약하게 만든다.

 

이 알고리즘은 기능을 중심으로 단백질을 구축하기 위한 딥 러닝의 첫 번째 진출이며 이전에는 상상할 수 없었던 치료의 문을 연다. 그러나 소프트웨어는 천연 단백질 핫스팟에 국한되지 않는다. Baker는 보도 자료에서 "자연에서 발견되는 단백질은 놀라운 분자이지만 설계된 단백질은 훨씬 더 많은 일을 할 수 있다."라고 말했다. 알고리즘은 "우리 중 누구도 할 수 없다고 생각한 일을 하는 것"이다.

 

단백질 핫스팟

 

Baker의 팀은 인공 정신으로 단백질을 예측하는 데 낯설지 않다. 몇 년 전 그들은 아미노산 서열만으로 단백질의 3차원 구조를 예측할 수 있는 소프트웨어인 Rosetta를 출시하여 구조 생물학 분야를 뒤흔들었다. 그들은 단백질 복합체를 추가로 매핑하고 단백질 "스크류 드라이버"를 처음부터 설계하여 바람직하지 않은 단백질 상호 작용을 분리했다. 작년 말, 그들은 trRosetta라는 딥 러닝 네트워크를 출시했는데, 이 네트워크는 아미노산 문자열이 나노 규모에서 복잡한 구조로 배열되는 방식을 일반화하는 AI "건축가"이다.

 

백업하자.

 

이 문장을 타이핑할 때 씹는 고기가 많고 힘줄이 있는 닭 날개로 단백질을 상상하기 쉽다. 그러나 분자 수준에서는 훨씬 더 우아하다. 여러 개의 레고 블록(아미노산)이 끈으로 묶여 있다고 상상해 보자. 이제 일부 블록이 서로 맞물릴 때까지 체인을 비틀면서 주위를 돌린다. 이것은 종종 나선이나 구겨진 침대 시트와 유사한 섬세한 구조를 형성한다. 일부 단백질에서 이러한 빌딩 블록은 복합체로 추가로 조립된다. 예를 들어 순찰 중인 주간 고속도로와 같이 세포의 보호막을 관통하는 채널을 제작한다.

 

단백질은 파트너에 따라 완전히 다른 결과를 유발할 수 있는 다른 단백질 또는 약물과의 일련의 상호작용을 통해 모든 단일 생물학적 과정에 동력을 제공한다. 잠재적인 침략자를 공격할 것인가, 아니면 물러날 것인가? 다시 말해단백질은 생명의 빌딩 블록이며, 그 구조를 분석하는 것이 우리가 생명을 해킹할 수 있는 방법이다.

 

여기 문제가 있다. 단백질의 모든 부분이 동일하게 생성되는 것은 아니다. 단백질이 인체인 경우 기능적 부위는 ""이다. , 다른 단백질이나 약물을 붙잡고 효소 반응을 일으키거나 침입하는 병원체와 싸우는 곳이다. 단백질 구조에 직접 내장된 이 부위는 정확히 찾아내기 어렵고 재현하기가 훨씬 더 어렵다.

 

새로운 연구는 Rosetta 버전으로 문제를 해결했다. 일부 사전 지식을 가지고 컴퓨터가 자연적으로 기능 부위로 접히는 아미노산 사슬을 꿈꾸는 것이 가능할까?

 

몽상가와 현실주의자

 

문제가 이상하게 보일 수 있지만 다른 분야에서 이전 예가 있다. OpenAI는 신경망을 사용하여 텍스트 캡션만으로 다양한 이미지를 생성했다. Rockstar AI 텍스트 생성기 GPT-3의 파생물인 DALL·E 알고리즘은 훈련에서 패턴을 감지하여 간단한 텍스트 프롬프트를 기반으로 환상적이면서도 사실적인 이미지를 생성했다. 도구가 처음 출시된 후 UC Berkeley Hany Farid 박사는 "상상력의 가장 깊고 어두운 오목한 부분을 가져와 섬뜩할 정도로 적절한 것으로 렌더링한다."라고 말했다.

 

단백질 기능 부위를 구축하는 것도 유사하다. 여기서 아미노산은 문자이고 단백질 기능 부위는 이미지이다. “아이디어는 동일하다. 신경망은 데이터의 패턴을 보도록 훈련될 수 있다. 일단 훈련을 받으면 프롬프트를 주고 우아한 솔루션을 생성할 수 있는지 확인할 수 있다.”라고 새 작업의 주 저자인 Joseph Watson박사가 말했다. 소설을 쓰는 것보다 알고리즘은 삶을 다시 쓰는 데 도움이 될 수 있다.

 

팀은 이전 작품인 trRosetta로 시작했다. 그것은 원래 아미노산 서열을 기반으로 새로운 단백질을 꿈꾸면서 그 구조를 예측할 수 있도록 설계된 신경망이다. 일부는 자연적인 것과 너무 달라 팀은 딥 러닝의 내부 작동을 "환각"이라고 불렀다. 알고리즘은 완벽해 보였다. 단백질의 아미노산 서열과 구조를 모두 예측할 수 있었다.

 

정말 효과가 없었다. 대조적으로, 단백질 구조 예측의 OG RoseTTAFold는 챔피언과 같은 성능을 보였다. 알고리즘의 힘은 설계에서 비롯된다. 나노 규모에서 각 아미노산을 모델링하고 각 원자에 좌표를 제공한다. Google 지도를 사용하여 지리적 사이트를 고정하는 것과 같이 이것은 AI가 추가로 반복할 수 있는 구조에 대해 일종의 "제약된 환각"에 대한 실제 수준을 제공한다.

 

, RoseTTAFold는 당면한 문제에 특정한 기능적 구조를 예측하고 최종 설계로 대략적인 스케치를 제시할 수 있다.

 

그런 다음 "그림 그리기"라는 또 다른 영리한 트릭이 나타났다. 여기에서 팀은 단백질 서열이나 구조의 일부를 숨겼다. 소프트웨어는 기본적으로 잡음이 있는 무선 차단에서 정보를 해독하는 방법을 배워야 했다. 여기서 처음 몇 단어만 들을 수 있지만 공백을 채워 의미를 이해하려고 시도한다. RoseTTAFold는 아미노산 서열과 구조를 모두 자동 완성하여 주어진 기능 영역을 충실하게 구성함으로써 "정보 누락 복구 문제"를 신속하게 해결했다.

 

RoseTTAFold는 아미노산 서열을 구축하고 사이트에 대한 백본을 생성하는 문제를 동시에 해결할 수 있다. 마치 종이에 단어를 적는 것과 같습니다. 작가는 각 글자가 올바른 위치에 있는지 확인하면서 문법과 의미가 맞는지 확인한다.

 

현실의 본질에 대한 질문

 

그들의 새로운 창조물을 시험하기 위해, 팀은 잠재적으로 바이러스와 암을 퇴치하거나 저철분 건강 문제에 도움이 될 수 있는 몇 가지 약물 및 백신 디자인을 생성했다.

 

수석 저자인 Jue Wang 박사에게 알고리즘은 예기치 않게 적절하게 되었다. 프로젝트를 진행하는 동안 그의 두 살배기 아들은 RSV(호흡기 세포융합 바이러스)에 의한 폐 감염으로 응급실에 입원했다. 일반적으로 감기와 유사한 증상을 나타내지만 젊은이와 노인에게는 치명적일 수 있는 바이러스이다.

 

당시 Wang은 백신과 약물을 추가로 테스트하기 위해 RSV에 잠재적인 사이트를 포함하는 새로운 치료법을 설계하기 위해 알고리즘을 사용하고 있었다. 비교적 잘 정리된 구조이다. 소프트웨어는 백신이 잠재적으로 결합할 수 있는 두 사이트를 요약한 디자인을 환각했다. 박테리아에서 재구성된 환각 단백질을 사용한 테스트는 기존 항체를 빠르게 포착했다. 이는 항체가 기능하고 딥 러닝 접근 방식이 작동한다는 신호이다.

 

Wang "이 사건을 통해 우리가 작업하고 있던 '테스트' 문제조차도 실제로 의미가 있다는 것을 깨달았다."라고 말했다.

 

몇 가지 추가 테스트에서 팀은 기본적으로 철 및 기타 중요한 금속을 흡수하는 방법에 대해 효소, 단백질 결합 단백질 및 금속 이온을 잡는 단백질의 기능적 부위를 설계했다.

 

강력하지만 성장의 여지가 있다. 이 방법은 천연 단백질을 이해할 수 있는 가능성을 열어줄 뿐만 아니라 잠재적으로 합성 생물학을 위한 새로운 단백질을 설계할 수도 있다. "이것은 매우 강력한 새로운 접근 방식이지만 여전히 개선의 여지가 많다."라고 Baker는 말했다.

 

전체적으로 딥 러닝의 또 다른 승리이자 AI와 생물학이 시너지 효과를 낼 수 있는 방법에 대한 흥미진진한 쇼케이스이다. Baker딥 러닝은 지난 2년 동안 단백질 구조 예측을 변형시켰고, 우리는 지금 단백질 디자인의 유사한 변형의 한가운데에 있다라고 말했다.

 

이미지 출처: Ian C. Haydon/UW 단백질 디자인 연구소. 단백질 구조에 대해 훈련된 새로운 인공 지능 소프트웨어는 호흡기 바이러스 RSV에 대한 이러한 후보 백신을 포함하여 기능 단백질을 몇 초 만에 생성할 수 있다.

 
인공지능, AI, 단백질설계, 백신, 제약 관련기사목록
광고
광고
광고
광고
광고
광고
많이 본 기사
AIbio소식 많이 본 기사