DRExplainer: Quantifiable Interpretability in Drug Response Prediction with
Directed Graph Convolutional Network
https://arxiv.org/abs/2408.12139
2025, arxiv, 5 citation
Drug response 연구 분야에서 어디까지 inteprebility가 연구되었는지 확인하기위함.
본 연구는 DRExplainer이란 모델을 제안했는데, 핵심 구조는 방향성있는 bipartite network이고 멀티 오믹스 데이터를 통합이다.
*bipartite network이란 두 종류의 노드 타입을 갖으며, 인접한 두 정점이 다른 타입이도록 구성된 네트워크를 말한다.

*멀티 오믹스라고 거창하게 시작하길래 뭘까했는데, Copy number profile를 입힌 것이 특징이다. 그외 gene expression, gene mutation profile도 존재한다.
*여기도 GDSC, CCLE 두 데이터 셋을 통합하면서 cell line, drug 풀이 적다: 986 cell lines, 358 drugs and a total of 295992 drug response data
보통 네트워크를 사용하면 path 기반으로 찾는다는 것일 텐데 아니나 다를까,
"the most relevant subgraph to each prediction in this directed bipartite network by learning a mask, facilitating critical medical decision-making."
즉, 노드를 껐다 켰다 하면서(mask) 성능에 크게 좌우하는 노드를 찾고, 해당 노드들을 잇는 subgraph로 해석하겠다고 한다. 이런 모델과 해석 방법은 2020년에 활발했던 방법론으로, 2025년에 나오기에는 조금 늦지않았나라는 생각을 했다. 하지만 동시 drug response 가 기본적으로 성능이 잘 나오는 테스크라서(bias인지 overfitting인지 모르겠지만) 최신 모델 도입이 어려웠어나 싶기도하다. 아님 새로운 기법이 추가되었는지 검토가 필요하다.
본 연구에서 강조하는 것 중 하나가 a quantifiable method 라는데. 뭔지 좀더 들어봐야겠고.
"model interpretability that leverages a ground truth benchmark dataset curated from biological features."
특히 interpretability groud truth 가 있나?? 싶어서, 공개데이터인지 어떻게 구성된 데이터인지 확인이 필요하다.

explainer랑 evaluator를 따로 둔 것이 핵심인데,
나도 생각해봤던 구조로 어떻게 explainer랑 evaluator를 연결했는지 확인해봐야겠다.
특히 Explainer에서 DisMult로 한다고?가 신기한 부분.
abstact + 모델 figure만 간단하게 봤을땐, 간단한 모델로 잘 푼 문제라고 생각되는데, 좀더 볼만한 논문인것 같다.
https://github.com/vshy-dream/DRExplainer
GitHub - vshy-dream/DRExplainer
Contribute to vshy-dream/DRExplainer development by creating an account on GitHub.
github.com
SOTA 모델로 MOFGCN, TGSA, DRUGCELL, NIHGCN으로 뽑았다. 정말 다 생소해서 뽑은 기준이라 무슨 모델인지 살펴볼 필요가 있을 듯 하다.
