보도자료
KIST, 신약 발굴 AI 기술로 세계 최상위 팀 선정
- 등록일 : 25-01-16
- 천연물시스템생물연구센터
- 조회수 : 800
-
첨부파일 :
KIST, 신약 발굴 AI 기술로 세계 최상위 팀 선정 |
- 자체 AI 기술로 신약후보물질 발굴 국제대회 CACHE 챌린지 상위 4개 팀으로 선정 코로나19 바이러스 치료를 위한 가장 독창적인 후보물질 제시 성공 |
한국과학기술연구원(KIST, 원장 오상록) 천연물시스템생물연구센터 박근완 박사팀은 제3회 CACHE 챌린지 중 코로나19 바이러스 표적 신약 후보 발굴 부문에서 세계 최상위 4개 팀에 선정됐다고 밝혔다. 신약 후보 예측 대회인 CACHE 챌린지에서는 가장 높은 성능을 보이는 AI 기술을 발표하며, 대회에서 얻어지는 모든 데이터는 일반에 공개해 후속 신약 개발 연구를 지원한다. 이와 같은 공동체 중심의 신약 개발 패러다임은 알파폴드가 참가한 단백질 구조 예측 대회인 CASP과 유사하다.
CACHE(Critical Assessment of Computational Hit-finding Experiments)는 다양한 신약 후보 물질 발굴 인공지능(AI) 방법의 예측 성능을 공정하게 평가하기 위해 2021년 조직된 국제적인 컨소시엄이다. 아스트라제네카, 바이엘, 베링거인겔하임 등 글로벌 제약사들과 협력하고 캐나다 정부와 미국 국립보건원(NIH)의 후원을 받고 있다.
이번 CACHE 챌린지는 코로나19 바이러스와 같은 치명적인 감염병 억제 약물 개발을 목표로 11개국 23개 본선 진출 팀이 약 2년간 경쟁하며 진행됐다. 참가팀들은 컴퓨터 기반 AI 예측 기술을 활용해 총 1,739개의 신약후보물질을 제안했으며, 2023년 1월 본선 참가팀이 선정된 이후 2024년 12월 최종 결과가 발표됐다.
KIST 연구팀은 천연물 신약 개발을 위해 자체 개발한 ECBS(Evolutionary Chemical Binding Similarity, 진화적 화합물 결합 유사성)라는 AI 모델을 활용했다. ECBS는 질병 표적 단백질의 진화 정보를 활용해 화합물 예측 정확도를 높인 새로운 AI 모델로, 현재 KIST 강릉분원 천연물연구소에서 천연물 신약 후보물질을 발굴하는 데 활용되고 있다.
본선에서는 실험적 결합 데이터 외에도 화합물의 결합력, 물성, 화학구조의 독창성을 종합적으로 고려한 심사가 진행됐다. 심사 결과, KIST(대한민국), 오타와대학교(캐나다), 브리티시 컬럼비아 대학교(캐나다), 베를린자유대학교(독일) 연구팀이 최종 우승팀으로 선정됐다. 연구팀은 코로나19 바이러스의 Nsp3 단백질을 표적으로 하는 혁신적인 저분자 화합물을 제시해 KIST의 AI 기반 신약 개발 기술의 우수성과 국제적 경쟁력을 입증했다.
향후 국내외 연구기관 및 제약사와의 공동연구를 통해 AI 기반 신약 개발 연구를 선도할 것으로 기대된다. 또한, 천연물 신약 개발을 통해 희귀질환과 난치병 치료 등 그동안 주목받지 못했던 분야에서 새로운 산업 창출의 가능성을 열어갈 것으로 보인다.
KIST 박근완 박사는 “AI를 활용한 신약 개발 연구가 코로나바이러스와 같은 치명적인 감염병 해결에 기여할 수 있다는 가능성을 보여주었다”라며, “이번 대회 결과를 바탕으로 국내외 기관과의 연구 협력과 정보 교류 활성화를 통해 글로벌 경쟁력을 갖춘 신약 개발 연구를 수행할 계획이다”라고 밝혔다.
본 연구는 과학기술정보통신부(장관 유상임)의 지원을 받아 KIST 주요사업 및 해양수산부(장관 강도형) 국가생명연구자원 선진화사업(RS-2021-KS211526)을 통해 진행됐다. 이번 대회 결과는 CACHE 공식 홈페이지에 발표됐다.
[그림 1] CACHE 챌린지 대회 설명
CACHE 챌린지에서 질병 표적 단백질이 정해지면 각 참가팀은 고유한 계산 방법을 이용해서 표적에 가장 잘 결합할 수 있는 화합물을 컴퓨터를 통해 가상으로 스크리닝한다. 참가팀에서 제출한 화합물은 CACHE 주최 측에서 실험적 검증을 거친 뒤 화합물의 구조적 독창성과 표적에 대한 결합력을 평가하여 최종 우승팀을 선정하게 된다.
그림 출처: https://www.nature.com/articles/s41570-022-00363-z
[그림 2] 제3회 CACHE 챌린지 대회 일정
(2022-12-02) CACHE 챌린지 제안서 접수 시작
(2023-01-01) 제안서 평가 및 1차 본선 진출팀 선정
(2023-03-15) 참가팀 화합물 예측 시작, 후보 화합물 제시 (최대 100개)
(2023-10-31) 실험 검증 데이터 공유, 2차 본선 진출팀 선정
(2024-01-01) 2차 본선 진출 팀에 한해 화합물 2차 예측 (최대 50개)
(2024-07-01) 2차 실험 검증 데이터 공유
(2024-12-11) 대회 마감 및 모든 데이터 일반에 공개
[그림 3] CACHE 챌린지에 활용한 KIST 화합물 예측 모델
KIST에서 자체 개발한 화합물 활성 예측 모델인 Evolutionary Chemical Binding Similarity (ECBS) 모델의 개념도이다. 표적 단백질의 진화 정보를 활용하여 화합물 예측의 정확도를 높인 AI 모델이며, CACHE 챌린지에서 해당 모델을 활용해 코로나 바이러스 저해 화합물을 탐색하였다.
[그림 4] AI 기반 화합물 가상 탐색 절차 모식도
컴퓨터와 AI 기술을 통해 신약후보물질을 효율적으로 탐색하는 가상 탐색 (Virtual Screening) 절차를 보여준다. 많은 비용과 시간이 소요되는 실험 기반 방법과 비교하여 AI 기술을 활용함으로써 최소한의 실험을 통해 효율적인 신약후보물질 발굴이 가능하다.