scXDR: drug response prediction across single-cell datasets via heterogeneous network transfer learning
https://www.nature.com/articles/s42003-025-09418-5
2026, Communications Biology
이 연구는 단일 세포(single-cell) 데이터셋 전반의 약물 반응 예측을 위한 네트워크 기반 전이 학습(transfer learning) 모델인 scXDR 모델을 제안한다. scXDR 은 약물, 유전자, 세포간의 특징과 연관성을 통합하기 위해 이종 네트워크를 활용한다. 이를 통해 message passing과 특징과 구조간 정렬(alignment), 구조 재구성(reconstruction), 그리고 약물-세포 반응 점수 예측을 수행한다. 실험 결과 scXDR는 bulk data로부터 single-cell 데이터로 전이하는 방식뿐만 아니라, singel-cell 데이터간 전이 방식이 기존 모델들을 여러가지 시나리오에서 능가했다. 특히 개별 세포 및 세포군 수준에서 우수한 성능을 입증했다. 모델 구성성분의 중요한 점을 또한 확인했다. case study는 1) 약물 휴지기(drug holiday) 처리에 따른 세포 결과 예측, 2) 흑색종(melanoma) 약물 스크리닝 및 multi-tumor 약물 반응 분석, 그리고 3) 환자의 셀에 대해 승인된 약물과 가능성있는 약물조합을 예측 결과를 포함한다. scXDR의 연구 전략과 결과는 세포 단위의 정밀 의료(precision treatment)실현을 위한 중요한 참조 모델을 제공한다.
3. Idea

4. Materials & Methods
- Cell-Target세포 - 유전자각 세포에서 발현량이 0이 아닌 유전자들을 모두 연결 (발현 여부가 기준)
- Cell-Cell세포 - 세포세포 간 피어슨 상관계수를 계산하여, 상관계수 절대값이 중앙값(Median) 이상인 쌍만 연결
- Drug-Target약물 - 유전자CTD 및 PubChem 데이터베이스를 쿼리하여 알려진 상호작용 정보 기반으로 연결
- Target-Target유전자 - 유전자Human Reference Interactome 데이터셋에서 유전자 간의 알려진 상호작용 정보를 필터링하여 연결
1. Composition (조성, C)
- 개념: 전체 서열에서 특정 특성을 가진 아미노산이 차지하는 비율입니다.
- 예시: "이 단백질 전체에서 소수성 아미노산은 30%, 친수성은 70%다"라는 식의 단순 비율 데이터입니다.
2. Transition (전이, T)
- 개념: 서열을 따라갈 때 특정 특성이 다른 특성으로 변하는 빈도를 측정합니다.
- 예시: '소수성' 다음에 바로 '친수성'이 나타나는 빈도가 얼마나 되는지를 봅니다. 이는 서열의 배열 순서(Pattern) 정보를 담고 있습니다.
3. Distribution (분포, D)
- 개념: 특정 특성이 서열의 어느 위치에 분포해 있는지를 측정합니다.
- 방식: 해당 특성을 가진 아미노산이 처음(0%), 25%, 50%, 75%, 마지막(100%) 지점에 위치하는 지점을 각각 수치화합니다. 이를 통해 서열의 구조적 형태를 짐작할 수 있습니다.
Take away
- 나는 통으로만 학습시킬 생각을 했는데, rna-seq을 활용해 전의 학습을 고안한 것이 존경스러움.
- 변동성이 큰 유전자 발현 값을 썼다는 것을 보고, 역시 이 방향으로 고려해야겠구만 싶었음
- case study를 잘해서 method 가 아니라 biology쪽으로 제출한것이 돋보였음.