https://academic.oup.com/bioinformatics/article/35/8/1427/5094509
GCTx format and cmap{Py, R, M, J} packages: resources for optimized storage and integrated traversal of annotated dense matrices
AbstractMotivation. Facilitated by technological improvements, pharmacologic and genetic perturbational datasets have grown in recent years to include millions
academic.oup.com
주석이 달린 데이터 행렬을 저장하는 데 사용되는 이진 파일로서, 대용량 파일에서 텍스트 기반의 GCT 파일 형식보다 성능을 향상시키기위해 개발되었다.
Matlab, Python, R 의 코드 라이브러리를 제공하는데, 이를 이용해 프로그래밍 방식으로 파일을 사용할 수 있도록 돕고있다.
python은 CMapPy, R은 CMapR, Matlab은 CMapM, java는 CMapJ
https://clue.io/developer-resources#codesection
아래는 CMapPy 설치방법과 튜토리얼이다.
conda install -c bioconda cmappy
'Bioinfomatics' 카테고리의 다른 글
1000genome 데이터 다운 받는 법 with Aspera(ascp), Linux (0) | 2022.10.21 |
---|---|
[Review]method for prediction miRNA target (0) | 2022.09.25 |
[RNA-seq analysis protocol] Differential gene and transcript expression analysis of RNA-seq experiments with TopHat and Cufflinks (수정중) (0) | 2022.08.19 |
[centrifuge] 설치 및 실행하기 (0) | 2022.08.12 |
[tophat] 설치하기 (0) | 2022.08.12 |