본문 바로가기

Bioinfomatics/microbiome

short-read metagenomics - step4. Taxonomic classification

분류학적 분석은 연구하고자 하는 환경의 미생물 분류군 조성을 파악하는 것으로서,

해당 환경의 생물학적 특성을 이해하는 데 가장 기초적인 단계입니다.[1]

 

전통적으로,  알려진 미생물 게놈 데이터베이스 (GeneBank) 정보를 활용해

서열(read또는 contig)을 일치(mapping)시키는 도구, BLAST을 이용해 분석해왔습니다.

 

그러나 분석할 수 있는 개체가 많아짐에 따라 다른 접근 방식이 필요했습니다.[2]

 

MetaPhlAn, Phylosift  mOTU

[MetaPhlan2]

MetaPhlan2는 전처리된 fastq file을 input으로 받는데 forward와 reverse 구분 없이 모든 read를 병합해서 사용한다.

bowtie2를 내부에서 사용해 clade-specific marker gene database에 mapping 한 후 bam file과 결과 profile text file을 output으로 얻게 됩니다.[3]

 

 

 

Reference

[1] https://koreascience.kr/article/JAKO201432558387471.pdf

[2] https://academic.oup.com/bib/article/22/1/178/5678919

[3] https://repository.kopri.re.kr/bitstream/201206/9045/1/000000031061.pdf