본문 바로가기

Paper

간단리뷰 Day 31. Ancestral diversity in complex disease genetics: from discovery to translation

Ancestral diversity in complex disease genetics: from discovery to translation

https://www.nature.com/articles/s41576-025-00921-3

2026, Nature reviews genetics

리뷰 논문임. 추후 자세하게 번역해서 공부하고자함.

 

다양한 조상 배경을 가진 유전체 코호츠의 확대는 복잡 질환 유전학의 판도를 바꿨다. 인구 집단간(across populations) 연관 불균형(LD)의 차이는 fine-mapping과 표적 유전자식별을 개선했으며, 이는 전장유전체연관분석(GWAS)의 결과를 생물학적인 이해로 전환하는 핵심 단계이다. 유전적 구조는 여러  조상 집단에 걸쳐서 널리 공유되기도 하지만( Whilst ), 인구 집단마다 인과적인 유전 효과의 이질성을 보이는 유전좌위(loci)는 고유한 생물학적 통찰력을 제공한다. 본 연구는 유조상 및 전지구적(global) 다양성이 유전학적 발견을 어떻게 형성하는지 검토한다(review). 글로벌 정밀 의료로 나아감에 따라, 유전체 데이터와 다양한 환경 및 사회적요인을 통합하는 것은  질병 위험 또는 치료 반응에 영향을 미치는 인종 특이적 맥락을 파악하는데 매우 중요할 것이다.

 

솔직히 abtract 만으로 어떻게 내용을 풀어갈것인지 잘 안 와닿았음.그래서 차근차근 저자의 주장을 따라가보고자함.

Introduction

1. 질병 발생의 불균형 (지역 및 인종별 차이)

질병은 유전뿐만 아니라 환경, 생활습관, 사회적 요인이 복합적으로 작용하여 나타나는데, 이 양상이 지역과 인종마다 크게 다름.

  • 비만율: 미국 성인은 42%인 반면, 일본은 5%에 불과합니다 (식습관 차이).
  • 암 발생률 (영국 사례): 전반적인 암 발생률은 흑인과 아시아인이 백인보다 낮지만, 전립선암의 경우 흑인 남성이 백인 남성보다 발생률이 2.1배나 높음.

2. 현재 유전학 연구의 심각한 편향성 (Eurocentric Bias)

지난 20년 동안 수많은 유전학 연구(GWAS)가 이루어졌지만, 데이터의 86%가 유럽 혈통(European ancestries)에 쏠려 있음.

  • 예측 정확도 하락: 유럽인 데이터를 기반으로 만든 '다유전자 위험 점수(PRS)'를 비유럽인에게 적용하면, 예측 정확도가 최대 4.9배까지 떨어집니다.
  • 의료 불평등: 이 기술을 그대로 임상에 도입하면 특정 인종만 혜택을 보고 다른 인종은 소외되는 결과(건강 격차 심화)를 낳을 수 있습니다.

3. 다양성이 확보되어야만 찾을 수 있는 유전자들

유럽인만 연구해서는 절대 찾을 수 없는 '보물 유전자'들이 다른 인종의 데이터에는 숨어 있습니다.

  • 일본인 대상 연구: 심부전 위험을 높이는 유전자 변이(TNNT2)를 발견 (유럽인 데이터에서는 탐지 불가).
  • 아프리카 혈통 연구: 만성 신장 질환의 원인을 밝혀줄 새로운 유전자 변이(ELN)를 발견.

 

 

4. 이 논문이 앞으로 다루려는 내용

  • 인류의 이주, 유전적 부동, 자연 선택이 어떻게 인종 간 유전적 차이를 만들었는가?
  • 다양한 인종의 데이터를 썼을 때 어떻게 새로운 유전자를 더 잘 찾고(Discovery), 원인 유전자를 정밀하게 특정(Fine-mapping)할 수 있는가?
  • 특정 인종에서 발견된 유전 법칙이 다른 인종에게도 똑같이 적용되는가?
  • 유전적 배경이 질병 유병률에 어떤 영향을 미치는가?

Human evolution and genetic diversity

 

From ancestral diversity to genomic discovery

Diversity in biobanks

1. 기존의 한계: 영국 바이오뱅크(UK Biobank)의 사례

가장 유명한 연구 자원인 UK Biobank는 50만 명의 데이터를 보유하고 있지만, 그중 비유럽계는 약 3만 명(6%)에 불과. 심지어 기존 연구들의 대부분은 분석의 편의성을 위해 이 3만 명의 데이터조차 제외하고 백인 데이터만 사용해 왔다는 점을 지적.

 

2. 비서구권 국가들의 자체 바이오뱅크 구축

백인 위주의 연구에서 벗어나기 위해 아시아와 아프리카를 중심으로 대규모 프로젝트들이 진행 중.

  • 일본 (Biobank Japan): 27만 명 참여, 47개의 주요 질병 연구.
  • 중국 (China Kadoorie Biobank): 51만 명 참여, 만성 질환 및 위험 요인 연구.
  • 아프리카 (H3Africa, NeuroGAP): 아프리카 과학자들이 주도하여 약 43,000명의 정신 질환 및 심혈관 질환 데이터 수집.
  • 파키스탄 (PARKH): 남아시아인(약 20억 명 인구에도 불구하고 연구가 매우 부족함)을 대상으로 우울증, 조현병 등 정신 건강 연구 진행.

3. 서구권 내 소수 인종 데이터 확보 노력

서구 국가 내에서도 소수 민종(Minority groups)은 인구 비율보다 더 많이 모집(Over-sampling)해야 통계적으로 유의미한 결과를 얻을 수 있음.

  • 미국 (All of Us): 100만 명 이상의 다양한 인종 데이터를 모으는 프로젝트로, 역사적으로 소외되었던 계층을 적극 포함
  • 영국 (Genes & Health): 영국 내 방글라데시 및 파키스탄인 10만 명을 모집. 특히 이 그룹에서 많이 발생하는 심혈관계 질환 연구에 집중
  • 전 세계 협력 (GBMI): 4개 대륙 29개 바이오뱅크가 연합하여 220만 명의 데이터를 통합 관리

Diversity-driven discovery

1. 전에는 존재조차 몰랐던 '새로운 변이'의 발견

연구 범위를 넓히자마자 발견된 유전 변이의 양이 폭발적으로 늘어났다.

  • GBMI(글로벌 바이오뱅크 연합): 유럽인 데이터만 봤을 때보다 2,180만 개의 유전 변이를 추가로 찾아냄.
  • All of Us 프로젝트: 전체 게놈 분석(WGS)을 통해 이전에 보고된 적 없는 2억 7,500만 개의 새로운 변이를 발견.
  • 아프리카 인구의 중요성: 인류의 기원인 아프리카 인구는 유전적 다양성이 가장 높기 때문에, 이들을 연구하면 특정 인종에만 존재하는 독특한 질병 위험 유전자를 찾을 가능성이 매우 높음.

2. 기술적 한계와 극복 방법 (칩 vs 시퀀싱)

그동안 왜 발견을 못 했는지, 그리고 어떻게 극복하고 있는지를 설명.

  • 기존의 한계 (DNA Microarray): 기존의 저렴한 유전자 칩은 주로 유럽인 데이터를 기준으로 설계되었습니다. 그래서 아프리카인처럼 유전 구조가 복잡한 인종의 변이는 아예 읽어내지 못하는 경우가 많았습니다.
  • 해결책 1 (WGS): 게놈 전체를 통째로 읽는 전체 게놈 시퀀싱(Whole-genome sequencing) 비용이 낮아지면서 인종적 편향 없이 모든 변이를 찾아낼 수 있게 되었습니다.
  • 해결책 2 (Imputation): 유전자 칩으로 읽지 못한 빈칸을 수학적으로 추론하는 '임퓨테이션(Imputation)' 기술을 쓸 때, **해당 인종과 일치하는 참조 데이터(Reference panel)**를 사용하면 훨씬 정확하게 유전 정보를 복원할 수 있습니다.

3. 왜 '다양성'이 '발견'으로 이어지는가?

유럽인에게는 아예 없거나 너무 희귀해서 통계적으로 유의미하지 않았던 유전자 변이가, 다른 특정 인종에게는 흔하게 나타날 수 있습니다.

  • 이를 통해 "이 유전자가 이 질병의 원인이었구나!"라는 새로운 연결고리(Trait association)를 찾게 되고, 이는 곧 새로운 치료제 개발의 단서가 됨.

Table 1 ❘ Notable global or ancestrally diverse genetics data resource

Fine-mapping. 

1. '범인'과 '구경꾼'을 구별하는 문제 (Linkage Disequilibrium)

유전자는 보통 덩어리(블록) 단위로 유전됩니다. 이를 **연관 불평형(LD)**이라고 합니다.

  • 문제점: 어떤 질병 유전자(범인)가 이동할 때, 주변의 아무 기능 없는 유전자(구경꾼)들도 함께 이동합니다. 그래서 유럽인 데이터만 보면 덩어리 전체가 범인처럼 보여서 정확히 누가 병을 일으키는지 알 수 없습니다.

2. 인종별 '유전자 덩어리'의 차이를 이용하기

인종마다 유전자의 역사(이주, 혼혈 등)가 다르기 때문에 이 덩어리의 크기와 모양이 제각각입니다.

  • 해결 원리: 만약 어떤 변이가 진짜 범인이라면, 유럽인에게서도 발견되고 동아시아인에게서도 발견되어야 합니다. 반면, 단순히 옆에 있어서 범인처럼 보였던 구경꾼들은 인종에 따라 덩어리에서 빠져나와 있을 수 있습니다.
  • 사례 (조현병 연구): CHRM3 유전자 근처를 조사했을 때, 유럽 데이터만으로는 후보가 7개나 되었습니다. 하지만 동아시아 데이터를 합쳐보니, 오직 **1개(rs11587347)**만이 두 인종 모두에서 강력한 범인 신호를 보냈습니다. 나머지 6개는 탈락한 것이죠.

3. 아프리카 혈통 데이터의 특별한 가치

아프리카 인구는 인류 역사상 가장 오래된 유전적 역사를 가지고 있어 유전자 덩어리가 매우 잘게 쪼개져 있습니다.

  • 이점: 덩어리가 작다는 것은 '구경꾼' 유전자의 수가 적다는 뜻입니다. 따라서 아프리카 데이터를 활용하면 범인 후보군(Credible sets)을 훨씬 더 작게 좁힐 수 있습니다. 실제로 미국 보훈부(MVP) 연구에서 유럽인보다 아프리카인 데이터를 썼을 때 후보군 크기가 훨씬 줄어들었습니다.

4. 놀라운 결과들 (Fine-mapping의 성과)

여러 인종의 데이터를 합치면 범인 후보군(Credible sets)의 숫자가 획기적으로 줄어듭니다.

  • 우울증: 후보 변이 숫자가 66개에서 30개로 감소.
  • 유방암: 후보 변이가 절반으로 감소. 심지어 어떤 구역(17q21.31)에서는 2,277개였던 후보가 단 2개로 압축되었습니다.

 

Novel biological insights

1. 담낭염(쓸개염)과 MYLK4 유전자 (중국 사례)

  • 발견: 중국의 'Kadoorie Biobank' 연구를 통해 MYLK4라는 유전자의 변이가 담낭염과 관련이 있다는 것을 처음 알아냈습니다.
  • 통찰: 이 유전자는 혈액 속의 '알칼리성 인산분해효소(ALP)' 수치와 연결되어 있었습니다. ALP는 담관 결석이나 급성 담낭염의 지표로 쓰이는데, 유전적 데이터를 통해 이 효소와 질병 사이의 생물학적 연결 고리를 확실히 증명한 것입니다.

2. 폐암과 텔로미어(Telomere) 조절 (일본 사례)

  • 발견: 'Biobank Japan'은 동아시아인에게만 나타나는 3가지 질병 관련 변이를 발견했습니다.
  • 통찰: 그중 하나가 POT1 유전자에 있는 변이였는데, 이 유전자는 세포의 수명과 관련된 '텔로미어'의 길이를 조절하는 단백질을 만듭니다. 이 발견은 **"텔로미어 조절에 문제가 생기면 폐암이 발생한다"**는 기존 가설을 더욱 강력하게 뒷받침하는 결정적인 증거가 되었습니다.

3. 전립선암 위험 2배 증가 (아프리카계 사례)

  • 발견: 미국의 'Million Veteran Program(MVP)'에서 아프리카 혈통 참여자들을 분석한 결과, PCAT2 유전자 근처의 변이를 찾아냈습니다.
  • 통찰: 이 변이를 가진 사람은 그렇지 않은 사람보다 전립선암에 걸릴 위험이 2배나 높았습니다. 이는 특정 인종에서 암 발생률이 왜 더 높은지를 설명해 주는 중요한 생물학적 단서가 됩니다.

Cross-population heterogeneity in genetic effects

Table 2 ❘ Methods and tools for genetic studies with diverse ancestries