2012, Molecular BioSystems, 379 citation
RWRMDA: predicting novel human microRNA–disease associations
Recently, more and more research has shown that microRNAs (miRNAs) play critical roles in the development and progression of various diseases, but it is not easy to predict potential human miRNA–disease associations from the vast amount of biological dat
pubs.rsc.org
Abstract
RWR을 이용해 잠재적인 miRNA-질병 상호작용을 추론한다.
기존의 로컬 네트워크 유사성 측정과 달리 글로벌 네크워트 유사성을 측정을 채택한다.
기능적 유사성이 곧 질병 연관성과 관련이 있을것이라는 가정하에, miRNA-miRNA 기능 유사성 네크워크를 구현했다
leav-one-out 교차 검증을 하고, 정확도 평가를 위해 세 가지 암(유방암, 대장암, 폐암)에도 적용해 예측된 상위 50개의 miRNA가 실험을 통해 증명되었다.
Introduciton
MicroRNA(miRNA)는 작은(~22nt) 비암호화 조절 RNA의 한 종류로,
일반적으로 서열 특이적인 염기를 통해 표적 mRNA의 3'-UTR에 결합하여 전사 후 수준에서 표적 mRNA의 발현을 억제합니다.
그러나 일부 보고서에는 경우에 따라 miRNA는 양성 조절자로도 기능할 수 있다고 지적합니다.
(양성 조절자가 있다/없다 이부분은 과학자마다 실험마다 주장하는 바가 다른것같다. )
(더불어서 전통적으로 3`-UTR 에서 결합하다고 한다. 하지만 일부 부고서에는 다른 지역에서도 결합이 존재할 수 있다고 하나 3`-UTR에 결합하는 것은 보편적인 사실인듯 하다.)
알려진 질병의 60%는 분자 수준의 병인 이해가 되지 않았습니다. 따라서 miRNA와 질병 사이의 관계에 대한 대규모 검색은 분자 수준에서 질병 병인의 이해를 가속화할 것이지만 더 중요한 것은 예후, 진단, 평가, 치료 및 질병 예방 및 인간 의학의 개선을 촉진할 것입니다.
miRNA와 질병 간의 관계에 대한 현재 지식은 상대적으로 제한적입니다. 기존 기술로 질병 관련 miRNA를 실험적으로 식별하는 것은 비용과 시간이 많이 듭니다. 따라서 전산 방법은 가장 유망한 miRNA 몇 개만 선택해 실험하여 실험 횟수를 줄이고 miRNA 기능을 이해하는 데 도움이 됩니다. 하지만 알려진 질병-miRNA 상호 작용 데이터가 희귀하여 여전히 연구에 어려움이 있습니다.
기존의 질병관련 miRNA 예측방법
가정1. 표현형 유사 질병이 기능적으로 관련된 miRNA와 연관성이 있다는 경향이 있다.
- ref3, 34 : 최초의 miRNA-질병 연관성 예측 방법이다. 유전자 온톨리지를 바탕으로 잠재적인 심혈관 질환 관련의 miRNA를 식별
miRNA 세트에 크게 의존적이다.
- ref 21 : hypergeometric distribution 기반,
miRNA 기능적 상호작용 network & disease similarity network & known phenome-microRNAome nework 를 통합
- 본 논문 : miRNA 기능적 네트워크 -> 스코어링 시스템에서 각 이웃정보만 사용 -> 글로벌 네크워크 유사성 정보를 활용
이 또한 예측된 miRNA target에 의존적이다.
현재 miRNA 표적 예측을 위한 in silico 예측 도구는 높은 위양성률과 높은 위음성 결과를 가지고 있는 것으로 알려져 있습니다 . 결과적으로 이 방법의 예측 정확도는 높지 않다.
- ref 22 : Naive Bayes 모델, 게놈 데이터 통합을 기반으로 후보 miRNA의 우선 순위를 정하는 접근 방식을 제안
질병-유전자 연관성 및 miRNA-표적 상호 작용의 데이터 세트에 크게 의존합니다.
인간 질병의 약 60%에 대한 분자 기반은 아직 알려지지 않았습니다.
- ref 29 : SVM 모델, microRNA-표적 데이터 및 표현형 유사성 데이터를 기반으로 특징을 추출
양성 질병 miRNA와 음성 질병 miRNA를 구별하는 접근 방식을 제안
- ref 28 : 특정 질병과 관련된 miRNA가 표적 mRNA의 비정상적인 조절을 보일 것이라는 가정
전립선암(PC) miRNA와 non-PC miRNA를 구별하기 위해 4개의 토폴로지 특징을 구성
후보 질병 miRNA의 우선 순위를 지정하는 네트워크 중심 방법을 도입
앞서 언급한 두 가지 방법(ref 29, 28)의 일반적인 문제는 특정 질병과 관련이 없는 miRNA들(Negative miRNA-disease)의 검증된 데이터가 없다는 것에 있다. 이러한 문제점이 신뢰성이 떨어지는 요인 중 하나이며, 이를 극복하기 위한 다양한 연구들이 진행되고 있습니다.(ref)
-ref 37 : OMiR, miRNA와 OMIM 질병 사이의 관계성 식별
miRNA 유전자좌와 OMIM 질병 유전자좌 사이의 중첩의 중요성을 계산함. (hypergeometric distribution)
종합하면 위에서 언급한 miRNA-질병 연관성 예측 방법에는 다양한 한계가 있습니다.
따라서 새로운 방법이 절실히 필요합니다.
이 논문에서 우리는 글로벌 네트워크 유사성 측정이 이웃 정보와 같은 전통적인 로컬 네트워크 유사성 측정보다 질병과 miRNA 사이의 연관성을 포착하는 데 더 적합하다는 가설을 조사했습니다.
글로벌 네트워크 유사성 측정 및 기능적으로 관련된 miRNA가 표현형 유사 질병과 연관되는 경향이 있다는 가정에 기초여,
RWRMDA(Random Walk with Restart with Restart for MiRNA-Disease Association) 방법은
miRNA 기능적 유사성 네트워크에서 임의 보행을 구현하여 관심 있는 질병에 대한 후보 miRNA의 우선 순위를 지정함으로써 잠재적인 miRNA-질병 연관성을 추론하기 위해 개발되었습니다.
Methods
The human miRNA–disease association data
miR2Disase, HMDD : miRNA-disease
dbDEMC : differentially expressed miRNa in human Cancers
The miRNA–miRNA functional similarity network
a functional similarity score for each miRNA pair is calculated based on the observation that genes with similar functions are often associated with similar diseases
각 miRNA 쌍에 대한 기능적 유사성 점수
- 유사한 기능을 가진 유전자가 종종 유사한 질병과 관련되어 있다는 관찰을 기반
- 즉 본 논문에서는 유사한 기능을 가진 microRNA 끼리는 유사한 disease를 공유한다는 가정 기반으로한다.
- matrix S ( i , j )는 miRNA i 와 j 사이의 기능적 유사성 점수, 0보다 큰 경우 네트워크의 에지로 연결되어 가중치로 사용
Random walk with restart for MiRNA–disease association (RWRMDA)
목적 : 관심있는 질병 d가 주어졌을때, 연관있는 잠재적 microRNA를 예측
seed node : d와 관련이 있다고 이미 알려진 microRNA
p(0) : initial probability, seed node =1, non-seed node=0
W = miRNA-miRNA 기능 유사성 매트릭스
r = 확률 (0 < r < 1)
p ( t + 1) = (1 - r ) Wp ( t ) + rp (0)
random walk stop : p ( t )와 p ( t +1) 사이의 변화가10−6 인 경우 cutoff
Results
실험적으로 확인된 1394개의 알려진 miRNA-질병 연관성에 대해 leave-one-out 교차 검증을 구현.
주어진 질병d와 알려진 miRNA는 테스트 셋에 제외
we just choose r = 0.2, which can be better selected by further cross-validation
FPR(1-specificity) 대 TPR(sensitivity)를 나타내는 ROC curve이다.
TPR : 알려진 microRNA-disease를 잘
RWRMDA의 성능에 대한 재시작 확률 r 의 선택을 조사하기 위해 우리는 0.1에서 0.9까지 다양한 r 값을 설정하고 leave-one-out 교차 검증의 프레임워크에서 AUC를 계산했습니다.
표 2 RWRMDA에 의해 예측된 유방암의 상위 50개 잠재적 miRNA 및 다양한 데이터베이스 및 문헌에 의한 연관성 확인. 상위 50개의 miRNA 중 49개가 유방암과 관련이 있는 것으로 확인되었습니다. 확인되지 않은 유일한 hsa-mir-142는 잠재적인 유방암 관련 miRNA의 예측 목록에서 46위에 올랐습니다.
miRNA 이름을 확인해보면, family level까지만 구분
아마miR2Disease가 family level까지만 구분해둬서 그런 것으로 파악된다. 아무래도 2009년도 발행물이다 보니 그런것 같고, 이후의 DB같은 경우 strand level까지 구분하는 것으록 파악된다. miRNA분야는 아직 연구중이기도 해서 그런지 몰라도 3p인지 5p 인지에 따라 target도 disease도 다르다.
유방암과 관련된 128개의 인간 miRNA(알려진 miRNA 및 상위 50개의 잠재적 miRNA 포함) 중
54개의 miRNA는 인간 배아 줄기 세포 조절이라는 특정
44개의 miRNA는 세포 주기 관련 기능과 관련
44개의 miRNA는 호르몬과 관련
그외 cell death, apoptosis and miRNA tumor suppressors 와 같은 다른 세 가지 풍부한 기능도 유방암 발병 과정에서 큰 관심사입니다. 대체로 이러한 암 관련 miRNA는 암의 주요 원인인 세포 분열, 세포 분화 등과 같은 몇 가지 중요한 생물학적 과정에 영향을 미칩니다.
Conclusions
제한 사항) 알려진 miRNA가 없는 질병에는 작동하지 않습니다. 이와 같은 경우 표현형 유사성 정보를 활용해 개선해볼 수 있습니다.
그외 RWRMDA는 실험적으로 검증된 miRNA-disease network 사용
그리고 보다 믿을만하고 안정적인 network를 통해 성능을 향상될 가능성이 있습니다.