아래는 "생물정보학 기반 miRNA target 유전자 예측 - 충북대 류제운,유재수,김학용" 을 정리한 내용이다.
알고리즘의 업데이트 사항이 없는지 추가 검토가 필요하다.
1. miRNA seed region
2. Evolutionary conservation of the MRE
3. Free energy of the miRNA-mRNA hetero duplex
4. miRNA sequence features outside the target site
1. seed 중심
seed region : miRNA 지녁 내 8nt 길이(과거)의 motifs와 상보성을 갖는 지역, motifs는 miRNA의해 전사후 조절을 받는다.
상보성이라는 특징은 target prediction에서 가장 강력한 feature가 되었다.
수백 ~ 수천 개의 타깃 mRNA는 3`UTR에 존재한다고 알려져
3`UTR과 miRNA의 seed를 alignment하는 방법이 대표적이다.
TargetScan
1. 여러 종에서 보존된 7-8mer의 miRNA sites를 모아 miRNA의 family로 모티프(motif)생성
2. miRNA와 상보적으로 결합할 수 있는 3`-UTR 지역의 mRNA 후보 생성
3. motiF와 mRNA 3`UTR 서열간 match
PicTar
+ TargetScan 1-3
<- match method : multiple sequence alignmnet, 서열의 유사성이 높은 유전자를 추려낸다.
miRanda
+ TargetScan 1-3
4. (miRNA와 타깃간의 duplex형성)결합 자유에너지가 안정적인 유전자를 추려낸다.
2. target site accessibility
PITA
1. 3'UTR에서 각 miRNA의 initial seed를 수집
2. model에 적용하여 예상 site를 찾아낸다.
3. miRN-3`UTR mRNA간 총 상호작용 점수(total interaction score) 계산한다.
- 이때 duplex 형성 자유에너지가 안정적인지
- 타깃의 2차 구조를 고려했을 때 miRNA가 실제로 타깃자리에 접근가능한지 고려한다.
3. miRNA sequence pattern
rna22
1. 이미 알려져 있는 mature miRNA 서열을 training dataset으로 하여 통계 적으로 의미있는패턴을 찾는다.
2. MRE 는 상호보완으로 결합하는 부위를 찾고 자유에너지값을 고려
- 각 종마다 보존되는 부위에 대해 고려하지 않고,
- 3'UTR에 한정짓지도 않으며
- seed의 mismatch를 허용한다.
위에서 소개한 예측 결과들은 miRNA당 예측한 타 깃 유전자의 개수가 수십에서 수백 개에 이르며,
false- positive 데이터와 같은 오류도 많기 때문에 결과에 대 한 실험적 검증이 필요하다.
'Bioinfomatics' 카테고리의 다른 글
[STUDY] DEG analysis (0) | 2022.12.02 |
---|---|
1000genome 데이터 다운 받는 법 with Aspera(ascp), Linux (0) | 2022.10.21 |
[GCTx format] (0) | 2022.08.19 |
[RNA-seq analysis protocol] Differential gene and transcript expression analysis of RNA-seq experiments with TopHat and Cufflinks (수정중) (0) | 2022.08.19 |
[centrifuge] 설치 및 실행하기 (0) | 2022.08.12 |