본문 바로가기

Bioinfomatics

[Review]method for prediction miRNA target

아래는 "생물정보학 기반 miRNA target 유전자 예측 - 충북대 류제운,유재수,김학용" 을 정리한 내용이다.

알고리즘의 업데이트 사항이 없는지 추가 검토가 필요하다.

 

1. miRNA seed region

2. Evolutionary conservation of the MRE

3. Free energy of the miRNA-mRNA hetero duplex

4. miRNA sequence features outside the target site

 

1. seed 중심

seed region : miRNA 지녁 내 8nt 길이(과거)의 motifs와 상보성을 갖는 지역, motifs는 miRNA의해 전사후 조절을 받는다.

상보성이라는 특징은 target prediction에서 가장 강력한  feature가 되었다.

수백 ~ 수천 개의 타깃 mRNA는 3`UTR에 존재한다고 알려져

3`UTR과 miRNA의 seed를 alignment하는 방법이 대표적이다.

 

TargetScan

1. 여러 종에서 보존된 7-8mermiRNA sites를 모아 miRNAfamily로 모티프(motif)생성

2. miRNA와 상보적으로 결합할 수 있는 3`-UTR 지역의 mRNA 후보 생성

3. motiF와  mRNA 3`UTR 서열간 match

 

PicTar

+ TargetScan 1-3

<- match method : multiple sequence alignmnet, 서열의 유사성이 높은 유전자를 추려낸다.

 

miRanda

+ TargetScan 1-3

4. (miRNA와 타깃간의 duplex형성)결합 자유에너지가 안정적인 유전자를 추려낸다.

 

2. target site accessibility

 

PITA

1. 3'UTR에서 각 miRNA의 initial seed를 수집

2. model에 적용하여 예상 site를 찾아낸다.

3. miRN-3`UTR mRNA간 총 상호작용 점수(total interaction score) 계산한다.

     - 이때  duplex 형성 자유에너지가 안정적인지

     - 타깃의 2차 구조를 고려했을 때 miRNA가 실제로 타깃자리에 접근가능한지 고려한다.

3. miRNA sequence pattern

rna22

1. 이미 알려져 있는 mature miRNA 서열을 training dataset으로 하여 통계 적으로 의미있는패턴을 찾는다.

2. MRE 는 상호보완으로 결합하는 부위를 찾고 자유에너지값을 고려

    - 각 종마다 보존되는 부위에 대해 고려하지 않고,

    - 3'UTR에 한정짓지도 않으며

    - seedmismatch를 허용한다.

 

위에서 소개한 예측 결과들은 miRNA당 예측한 타 깃 유전자의 개수가 수십에서 수백 개에 이르며,

false- positive 데이터와 같은 오류도 많기 때문에 결과에 대 한 실험적 검증이 필요하다.