본문 바로가기

Paper

간단리뷰 Day19. Emerging drug interaction prediction enabled by a flow-based graph neural network with biomedical network

Emerging drug interaction prediction enabled by a flow-based graph neural network with biomedical network

https://www.nature.com/articles/s43588-023-00558-4

2023, Nature Computational Science, 70 citation

우선, 권한이 없어서 arixiv로 봄

 

신규 약물(emerging drugs)의 약물-약물 상호작용(DDI)은 질병 치료 및 완화의 새로운 가능성을 제시하며, 이를 계산적인 방법으로 정확히 예측하는 것은 환자 관리 수준을 향상시키고 효율적인 신약 개발에 기여할 수 있다. 그러나 기존의 많은 계산 방식들은 대량의 알고있는 DDI 정보를 필요로하는데, 이는 데이터가 부족한 신규 약물의 경우 적용하기 어렵다는 한계가 있다.

본 연구에서는 생의학 그래프에서 풍부한 정보를 활용하여 신규 약물의 상호작용을 효과적으로 예측할 수 있는 그래프 신경망인 EmerGNN을 제안한다. EmerGNN은 양물 쌍 사이의 경로를 추출하고, 한 약물에서 다른 약물로 정보를 전파하며, 경로상에 존재하는 관련 생물 의학적 개념들을 통합시킴으로써 약물쌍의 표현을 학습한다. 이때 biomedical network의 간선들은 목표하는 DDI 예측에 대한 중요도를 나타내는 가중치가 부여됩니다.

결과적으로 EmerGNN은 신규 약물 상호작용 예측에서 기존의 방식보다 높은 정확도를 기록했으며, biomedcial network내에서 예측과 가장 관련이 깊은 정보를 식별해낼 수 있음을 확인했다.

1. Path-based subgraph sampling

2. Edge Weighting

1. Problem

  • 신규 약물에 대한 부작용 예측의 어려움
  • 신규 약물에 대한 데이터는 희소하여, 상호작용 데이터가 부족함.
  • 기존의 GNN는 이를 반영하여 설계하지 않음.

2. Related Work

  • 약물 특징/구조 기반
    • fingerprints나 수동으로 설계된 특징(hand-designed features)을 사용하여 상호작용을 예측
    • cold-start 환경에서도 작동하나
      표현력이 낮고 약물간의 상호 정보를 무시하는 경향이 있음
  • DDI를 그래프 구조로 학습한 방식
    • 데이터가 풍족한 경우에만 효과적
  • HetioNet과같은 생의학네트워크를 활용한 방식
    • Tanvir 등: 생물 의학 네트워크로부터 수동 설계된 메타패스(metapaths)를 추출하여 활용
    • Karim 등: 네트워크로부터 임베딩을 학습하고 딥러닝 모델을 결합하여 예측을 수행
    • 다른 방법보다 강력한 노드 표현력을 얻었지만, 여전히 신규 약물에 대해 제한적.

(개인적으로 약물 구조정보만큼 강한 표현력이 없다고 생각하지만.. 어떤 기준을 두고 강하다/약하다하는지...)

3. Idea

a. 문제 정의:

(시나리오 1) 세상에 막 등장한 '신약(u)'이 '기존 약(v)' 간의 

혹은 (시나리오 2) 두 신약(u,v) 끼리 부작용이 생길지, 아니면 효과가 좋을지 알아내고자함.

b. augmented network:

여기서 증강이라는 표현이 생소했음. 왜냐하면 당연하게 KG기반의 논문이라고 생각했기 때문.

  • 기존 방식의 한계: 종래의 DDI 예측 모델은 주로 약물 구조의 표현체(Representation) 간 비교를 통해 부작용이나 시너지 관계를 도출하는 구조 기반 접근법에 치중함.
  • 증강의 개념: 단순히 하나의 KG를 학습하는 차원을 넘어, 단편적인 DDI 데이터에 방대한 생물 의학 네트워크를 배경지식(Side information)으로 결합하는 것을 의미함. 결과 정보(Interaction)만 존재하던 기존 네트워크에 생물학적 메커니즘을 수직적으로 통합하여 정보의 범위를 확장했으므로, 이를 '증강(Augmented)'이라 명명함. 이는 약물의 위치와 경로를 기반으로 한 네트워크 중심의 추론을 가능하게 함.

c. path-based subgraph:

u와 v 사이의 핵심 경로 찾기, 너무 먼 길은 무시하고 최대 3~4단계안에 연결되는 핵심 경로들만 모아서 작은 요약 지도(서브그래프)찾는 것임. 핵심 단서

 

d. Flow-based GNN

attention 방법을 활용해 관련높은 엔티티에 집중하도록 함. subgraph로 gnn 학습을 함으로써 기존의 약(v)정보를 통해 신약(u)정보를 업데이트함.

 

-> 여러 subgraph상에서 flow 학습을 시킨다는 것이 다른 것 같음