본문 바로가기

Paper

간단리뷰 Day15. Pharmacogenomics polygenic risk score for drug response prediction using PRS-PGx methods (evaluation 좀더 볼 것 )

Pharmacogenomics polygenic risk score 
for drug response prediction using PRS-PGx methods

https://www.nature.com/articles/s41467-022-32407-9

2022, nature communications, 43 citation

PRS를 drug response prediciton에 사용한다는 개념을 처음 보는데 흥미롭다.

 

지난 몇 년간 PRS는 인간 질병과 복잡한 형질을 예측하는데 성공적으로 개발되어왔다. 무작위 대조 임상시험(randomized clicnial trials)에서 약물 반응 예측은 일반적으로 질병 GWAS로부터 구축된 PRS를 약물유전체학(Pharmacogenomics, PGx) 환경에 그대로 적용하는 것이 일반적인 관행이다.

그러나 본 연구에서는 이러한 접근법이 선택된 유전 변이들의 예후 효과(progenostic effects)와 예측 효과(predictive effects)에 대해 매우 엄격한 가정(strict assumptions)에 의존하고 있음을 보인다. 이에 따라, 우리는 질병 기반 PRS에서 PGxPRS 접근법으로의 전환을 제안며, 두가지 효과를 동시에 모델링하는 방식을 통해 이를 실현한다. 이를 위해 우리는 일련의 PRS-PGx 방법들을 개발하였으며, 그중에는 새로운 베이지안 회귀 접근법(PRSPGx-Bayes)도 포함된다.

시뮬레이션 연구 결과, PRS-PGx 방법론이 전반적으로 기존 질병 기반 PRS 방법보다 우수한 성능을 보였고, 특히 PRs-Gx-Bayes가 모든 다른 PRS-PGx 방법들보다 뛰어난 결과를 나타냈다. 또한 우리는 PRS-PGx 방법들을 대규모 심혈관계 무작위 대조 임상시험(IMPROVE-IT)의 PGx GWAS 데이터에 적용하여, 치료 관련 LDL 콜레스테롤 감소(treatment-related LDL cholesterol reduction)를 예측하였다. 그 결과, PRS-PGx-Bayes는 기존 질병 PRS 접근법에 비해 예측 정확도(prediction accuracy)와 치료 특이적 예측 효과(treatment-specific predictive effects) 포착 능력 모두에서 뚜렷한 향상을 보여주었다.

*PGx 개인의 유전적 차이에 대한 약물에 대한 반응에 어떤 영향을 미치는지 연구
같은 약이라도 사람마다 약효/부작용 차이가 있다. 이는 유전적 변이는 약물을 분해하는 효소의 활성을 야기하기 때문.

1. Problem

  • 기존의 PGx 바이오마커는 큰 효과 크기(large effect size)에 의존적임, 효과가 작지만 실제적인 유전 변이는 유의성 임계값을 넘지 못함.
  • 기존의 disease-PRS 접근법이 갖는 한계를 극복하기 위해

2. Idea

  • 약 먹었을 때만 나타나는 SNP 효과(α)는 실제로 존재하고, 매우 크다.

✔ IMPROVE-IT 임상시험 (논문에서 사용한 실제 데이터)

  • 어떤 SNP들은 LDL 자체에는 거의 영향 없음
    (baseline 효과 β는 0에 가까움)
  • 그런데 약물(에제티미브/스타틴)을 먹으면 LDL 감소량이 크게 달라짐
    (interaction effect α는 매우 큼)

→ 이게 바로 predictive SNP
→ 즉, “약물 반응을 바꾸는 유전자”

3. Materials & Methods

a high-dimensional regression model of n patients and m SNPs

유전형의 주효과(prognostic effect, β)와
유전형×치료 상호작용 효과(predictive effect, α) 두 가지를 동시에 모델링

Y 연속형 약물 반응 phenotype
X 공변량(나이, 성별, baseline 수치, PC 등)
γ 공변량의 효과 크기 벡터
T 치료군 여부 (0/1)
β SNP의 prognostic(main) effect
α SNP의 predictive(SNP×treatment) effect
G 유전체 SNP 행렬
G×T 치료군에서만 나타나는 SNP 행렬
ε 랜덤 오차

PGx PRS는 두 가지 점수로 구성

PGx PRS =

  • baseline genetic risk (S_prog) + treatment-specific genetic response (S_pred)
  • = ‘약물 반응은 기본 유전 효과 + 약물 특이적 유전 효과’

이 두 가지를 통합함으로써 disease-PRS 접근법보다 훨씬 정확하게
누가 약물에 더 잘 반응하는지’를 예측

PRS-PGx는 아래 두 가지 점수를 구성

PRS-PGx 알고리즘 종류

논문에서는 6개의 PGx 전용 PRS 모델을 제안:

PRS-PGx-Unadj 전체 SNP 효과를 그대로 합산
PRS-PGx-CT LD-clumping + p-value thresholding 방식
PRS-PGx-L Lasso penalized regression
PRS-PGx-GL Group Lasso
PRS-PGx-SGL Sparse Group Lasso
PRS-PGx-Bayes Bayesian shrinkage 기반 (가장 성능 우수)

 

특히 PRS-PGx-Bayes

  • main effect(β)
  • interaction effect(α)
  • 두 효과 간 상관(ρ)
    모두를 추정하며 S_prog와 S_pred를 동시에 구성할 수 있음.

4. Evaluation & Findings ***

결과가 애매함!!   R squre가 0.3 미만인 이유: 

원래 데이터규모가 13만개 만 개부터 시작하는데, 논문에서는 1000, 3000개로 적은 test 규모임.

  • 시뮬레이션
    • 가설: 모든 인과 변이가 예후+예측 효과를 동시에 갖는다 / 하나만 갖는다.
  • IMPROVE-IT = 심혈관계 환자를 대상으로
    • 스타틴 + 에제티미브(지질 낮추는 약)
      vs
    • 스타틴 단독 치료
      비교한 대규모 무작위 임상시험.

5. Take away

  • 데이터 이슈만 해결되면, 새로운 방안으로써 PG 데이터를 고려하는 것이 좋아보인다!