Harnessing Artificial Intelligence for Genomic Variant Prediction: Advances, Challenges, and Future Directions
2026, Giga science
정확한 유전 변이 해석은 질병 연구 및 표적 치료제 개발의 핵심입니다. 인공지능(AI)은 구조 생물학, 진화 분석, 그리고 멀티모달 유전체 데이터를 가로지르는 계산 방법론을 통합함으로써 이 분야를 혁신하고 있습니다. 본 리뷰는 전통적인 규칙 기반 시스템 및 통계 모델에서부터 현대의 머신러닝(ML), 딥러닝(DL), 단백질 언어 모델에 이르기까지의 발전 과정을 살피는 한편, 변이 분류의 주요 과제들을 다룹니다.
데이터의 이질성, 해석 가능성, 그리고 미분류 변이(VUS)의 지속적인 발생은 주요 장애물로 꼽히며, 이는 다양한 인구 집단에 대한 예측 정확도를 높이기 위한 설명 가능한 AI(XAI) 프레임워크와 포괄적인 유전체 데이터베이스의 절실한 필요성을 시사합니다. 본 연구는 현재의 변이 영향 예측 도구(VIPs) 평가를 바탕으로, 최적의 예측 모델 선택, 효과적인 멀티오믹스 데이터 통합, 그리고 최적화된 계산 워크플로우 전략을 제안합니다. 이러한 제안은 연구와 임상 현장(clinical practice) 모두에서 변이 해석의 정확도를 높여, 궁극적으로 정밀 의료의 발전에 기여하고자 합니다.