본문 바로가기

Paper

간단리뷰 Day2. KGML-xDTD: A Knowledge Graph-based Machine Learning Frame work for Drug Treatment Prediction and Mechanism Description

KGML-xDTD: A Knowledge Graph-based Machine Learning Framework
for Drug Treatment Prediction and Mechanism Description

https://academic.oup.com/gigascience/article/doi/10.1093/gigascience/giad057/7246583

2023, Giga science, 29 citation

강화학습 기반 meta path 방법론이라서, 결과 이미지만 보려고함.

1. Problem

  • 약물과 표적 질환 간의 기전(MoA) 대부분 발견되지 않았다. <- 내가 처음 introuction으로 작성하려고했던 내용임..
  • 약물-질병 치료 확률 + KG 기반의 설명(GRL, 강화학습으로 경로 탐색 과정)

2. Related Work

  • KG GNBR를 활용해 문헌에 기반한 그래프 임베딩 모델 UKGE개발,
    이는 실제 문헌에 나타나는 관계 빈도를 엣지에 활용해 신뢰점수로 환산하여 설명가능한 모델을 구축함.
    실제 문헌 기반이기 때문에 신뢰할 수 있나, 문헌이 있꼬 + BKG에 있는 엔티티에대해서만 적용가능함.
  • 그외, TransE, GrEDEL(LSTM+RNN) 임베딩 모델: 예측한 MOA가 얼마나 합리적인지 충분히 평가하지 못함.
  • 강화 학습이 유망한 솔류션인데, 기존의 방법론들은
    • 계산적으로 비효율적인 모델
    • 대규모이고 복잡한 BKG 확장의 어려움

3. Idea

4. Materials & Methods

  • DrugMechDB: 전문가가 큐레이팅한 경로 기반 약물 MOA 데이터베이스
  • MyChem Data: BioThings API에서 제공 11개의 신뢰할 수 있는 데이터 리소스, 최신 리소스임."적응증" 관계가 있는 약물-질병 쌍을 참 양성으로 사용하고, "금기증" 관계가 있는 약물-질병 쌍을 참 음성으로 사용
  • SemMedDB: Semantic MEDLINE 데이터베이스(SemMedDB)에서 제공하며, 자연어 처리(NLP) 기법을 활용하여 PubMed 초록에서 "treats" 및 "negatively treats" 관계를 갖는 의미적 트리플을 추출한 리소스. "treats" 관계를 갖는 약물-질병 쌍을 참양성(true positive)으로, "negatively treats" 관계를 갖는 약물-질병 쌍을 참음성(true negative)으로 사용
  • NDF-RT: 미국 재향군인보건청(VHA)의 National Drug File-Reference Terminology에서 제공, 여기에는 약물 상호작용, 적응증 및 금기증에 대한 FDA 승인 정보가 포함. 약물-질병 중 치료제 라벨이 있는 "적응증"을 진양성으로, "금기증"을 진음성으로 사용
  • RepoDB: 하버드 의과대학 블라바트닉 연구소에서 수집한 임상 시험에서 성공 및 실패한 약물-질병 쌍의 표준 집합입니다.
    "승인" 상태의 약물-질병을 진양성으로, "종료" 상태의 약물-질병을 진음성으로 사용

 

KG 에서 graphSAGE로 노드 임베딩하여 강화학스으로 MoA prediction:

 

4. Evaluation & Findings

사례1. 혈우병

혈액 응고 조절 네트워크(화살표: 분자 반응(검정색), 양성 피드백(녹색), 음성 피드백(빨간색))

모델이 혈우병에 대하여 여러 약물의 치료 확률을 계산했는데, 

가장 확률이 높은 약물 top3(0.833~0.789)은 이미 처방된 약물이고 나머지가 newly inferred candidates.

 

figure5. 예측된 MOA 경로 vs. 사람-전문가가 만든 정답 경로’ 비교 그림.

RTX-KG2 기반 예측 경로(3-hop) 중 상위 5개를 보여주며, 이 중 DrugMechDB와 일치하는 경로는 빨간색으로 표시함.
RTX-KG2(모델의 지식그래프)와 DrugMechDB(사람이 정리한 MOA DB)는 동일 개념의 서로 다른 이름(synonym) 을 쓸 수 있으므로,
시각화를 위해 일관된 명칭으로 통합함.

  • (A, C) KGML-xDTD 모델이 각각 Eptacog Alfa, Nonacog Alfa 에 대해 예측한 3-hop 경로 그래프
  • (B, D) DrugMechDB 전문가가 정리한 MOA 경로(정답)

5. Take away

“블랙박스” 형태의 AI 모델을 생물학적으로 설명 가능한 체계로 확장한 모델

화학 구조, 약물-표적 상호작용, 유전자 발현의 약물 교란을 기반으로하는 AI 모델보다 

-> 비용 절감, 희귀 질환 샘플 가용성 한계 등 면에서 효율적이다.

-> 구체적인 설명으로 확장하려고하는데, 특정 약물이 질병에 해로운 이유를 설명할 수 있도록 하려고함.