본문 바로가기

Bioinfomatics

[GCTx format]

https://academic.oup.com/bioinformatics/article/35/8/1427/5094509

 

GCTx format and cmap{Py, R, M, J} packages: resources for optimized storage and integrated traversal of annotated dense matrices

AbstractMotivation. Facilitated by technological improvements, pharmacologic and genetic perturbational datasets have grown in recent years to include millions

academic.oup.com

 

주석이 달린 데이터 행렬을 저장하는 데 사용되는 이진 파일로서, 대용량 파일에서 텍스트 기반의 GCT 파일 형식보다 성능을 향상시키기위해 개발되었다.

Matlab, Python, R 의 코드 라이브러리를 제공하는데, 이를 이용해 프로그래밍 방식으로 파일을 사용할 수 있도록 돕고있다.

python은 CMapPy, R은 CMapR, Matlab은 CMapM, java는 CMapJ

https://clue.io/developer-resources#codesection

 

아래는 CMapPy 설치방법과 튜토리얼이다.

conda install -c bioconda cmappy

https://github.com/cmap/cmapPy/tree/master/tutorials