본문 바로가기

Paper

간단 리뷰 Day 22. MetaMDA: explainable prediction of microbe–drug association utilizing random walks on a microbe–metabolite–drug heterogeneous network

MetaMDA: explainable prediction of microbe–drug association utilizing random walks on a microbe–metabolite–drug heterogeneous network

https://academic.oup.com/bioinformatics/article/41/12/btaf649/8362262

2025, Bioinformatics

2개의 관심분야가 만나는 연구로써 동향확인하기위해 읽게됨.

 

인체관련 미생물(Human-associated microbes)은 생리학적 과정과 암을 포함한 질병 발달에서 중요한 역할을 한다. 미생물과 약물간의 연관성(MDAs)을 예측하는 것은 신약개발(drug discovery)과 맞춤형 의료에 큰 도움이 될 수 있다(can aid N). 하지만 기존의 방법론들은 레이블링이된 데이터에 존재하지않는 미생물과 약물이 포함된 MDAs를 예측할 수 없으며, 또한 미생물과 약물 사이의 생물학적 매커니즘을 이해하는데 실패한다.

 

이를 극복하기위해, 우리는 새로운 컴퓨팅 프레임워크인 MetaMDA를 제안한다. MetaMDA는 microbe–metabolite–drug 네트워크상에서 random walk를 수행함으로써 MDAs를 예측한다. MetaMDA는 먼저 미생물, 대사체, 약물을 통합한 이종 그래프를 구축하여 복잡한 생물학적 상호작용을 모델링한다. 그 후, 맞춤형 전이 확률(Transition Probabilities)을 갖춘 랜덤 워크 알고리즘을 그래프에 적용하여, 통합된 척도에서 여러 노드 유형의 특징을 효과적으로 포착한다.

다양한 데이터셋에 걸친 실험 결과, MetaMDA는 기존의 최첨단(State-of-the-art) 방법들보다 일관되게 우수한 성능을 보였으며, 평균 26%의 성능 향상을 달성했다. 특히, 아카보스(Acarbose) 관련 사례 연구를 통해 학습 데이터에 포함되지 않은 미생물이나 약물이 포함된 MDA를 예측하는 MetaMDA만의 독보적인 능력을 입증했다. 또한, MetaMDA의 기전 분석(Mechanistic Analysis)은 대장균(Escherichia coli)과 에스시탈로프람(Escitalopram) 사이의 연관성에 대한 생물학적 설명을 제공하며, 이는 미생물-약물 연관성에 대한 깊이 있는 메커니즘적 이해를 이끌어낼 수 있는 잠재력을 시사한다.
Zenodo: https://doi.org/10.5281/zenodo.17348446
GitHub: https://github.com/wqlyt17/MetaMDA

 

GitHub - wqlyt17/MetaMDA

Contribute to wqlyt17/MetaMDA development by creating an account on GitHub.

github.com

 

> Methods

요약) RWR기반 10길이의 node 시퀀스 생성후, Skip-gram으로 임베딩 XGBoost으로 예측하는 모델

figure1. metaMDA의 프레임워크

 

1. 데이터 생성: 이종 네트워크의 각 노드에 대해 길이가 10인 경로를 총 100회 생성(Random Walk)
2. 임베딩 학습: 생성된 노드 시퀀스로부터 특징을 추출하기 위해 Skip-gram 모델(Node-type-aware heterogeneous Skip-gram model)을 사용하여 임베딩 표현을 학습

3. 예측: 학습된 임베딩을 XGBoost 분류기의 입력값으로 사용하여 미생물-약물 연관성(MDA)을 정확하게 예측함.
4. 새로운 노드 예측 능력: MetaMDA는 레이블링된(학습용) MDA 데이터셋에 존재하지 않는 미생물이나 약물이 포함된 연관성도 예측할 수 있도록 함.
“+ new node”: 학습 데이터셋에 없는 새로운 미생물이나 약물이 포함된 MDA 예측.
“– new node”: 이미 학습 데이터셋에 포함되어 있는 미생물이나 약물 간의 MDA 예측.

 

> Results

MetaMDA provides biological mechanistic insights for MDA prediction

Figure 6.Mechanism analysis of MetaMDA.

(A) 랜덤 워크 모델을 통해 생성된 노드 시퀀스 중, 대장균(E. coli) 또는 락토바실러스 브레비스(Lactobacillus brevis)를 포함하는 시퀀스에서 가장 빈번하게 나타나는 약물과 대사체들과 MetaMDA 모델의 예측 점수.

(B) 대장균과 에스시탈로프람(escitalopram), 그리고 락토바실러스 브레비스와 플루옥세틴(fluoxetine) 사이의 상호작용 기전:

- E.coli + Escitalopram: 여러 연구에 의해 대장균이 생성하는 글루타메이트와 항우울제인 에스시탈로프람은 신경 및 정신 질환의 발생과 치료에서 시너지 효과를 낼 수 있음.

 

-> 링크 예측 문제'로만 취급하는 기존 방식들과 다르게
MetaMDA는 미생물과 약물 사이의 근본적인 생물학적 상호작용 기전을 이해하고 있다고 주장.

Take away

  • 약물 task에서 main 주제들은 발전할만큼 했다고 생각했음,
    이런 소주제(drug-meta)에서 간단한 모델만으로도 논문을 낼 수 있구나를 확인함.
  • 특히 AUC가 0.88 ~ 0.97로 기본적으로 예측이 쉬운 테스크임을 또한 같이 확인함.
  • 여전히 metabolism 이해 및 새로운 link prediction에는 RWR+skip gram 조합 모델이 견줄만하다는 것을 확인함.