전체 글 (69) 썸네일형 리스트형 Single Cell Transcriptomics Reveals the Hidden Microbiomes of Human Tissues https://www.biorxiv.org/content/10.1101/2022.10.11.511790v2이제 막 연구되는 분야 중 하나인 single cell에서의 microbiome.생물학자들은 어떤 결과를 보고 싶어하고, 어떤 어려움을 겪고있는지 살피기 위함이다.더불어 어떻게 데이터가 만들어지고 어떤 정보가 있는지 공부하고자 한다. Motivation & Purposecreate an atlas of human tissue microbiome, called Tabula Sapiens Microbiome.11 human organ19 tissue type400,000+ annotaed cells100+ cell types~70 billion sequences from bacterial, viral a.. Deep learning in biomedicine https://www.nature.com/articles/nbt.4233처음 bioinfomatics를 접하는 인턴생을 위한 저널 클럽 논문이다.내용이 너무 얕고 광범위하여 처음듣는 용어 및 관심있는 주제를 중심으로 정리했다.이 논문의 핵심은 3-4페이지로써, DL이 어떻게 application 적용되는지가 중요했다. Motivation & Purpose이미 딥러닝 모델은 다양한 분야에서 성공 수준으로 예측 결과를 제공한다. 그러나 딥러닝이 실제 임상에서의 성능을 보장하는지, 그리고 딥러닝 결과를 바탕으로 의사 결정하는 것이 옳은지에 대한 근거와 신뢰가 필요하다.따라서 본 논문은 biomedicine 분야에서 ML과 DL 사용 사례, 효과, 한계를 광범위하게 설명한다.ML vs DL MLDLData s.. Accurate proteome-wide missense variant effect prediction with AlphaMissense https://www.science.org/doi/10.1126/science.adg7492저널 클럽으로 선정된 논문이다.VEP 예측 연구 참고용 논문으로 mathod/materials 중심으로 보고자한다.*파란색으로 표시된 문장은 주관적인 생각이므로 해석에 유의 Motivation & Purpose 동기시퀀싱 기술의 발달로 인간 집단내 수 많은 유전적 변이를 밝혀냈다.특히 점돌연변이 missense variant의 경우 아미노산 서열을 바꾸기 때문에 pathogenic 경향이 있고 해당 단백질의 기능과 건강을 완전히 망가트린다.관찰된 400만개가 넘는 관찰된 missense vaiant 중에서 clinically하게 밝혀진것은 전체 2%(8만개) 뿐으로여전히 변이를 분류하는 것은 지속적인 과제이다.기.. EnsembleCNV: an ensemble machine learning algorithm to identify and genotype copy number variation using SNP array data https://academic.oup.com/nar/article/47/7/e39/5306576 우리의 ensemble method를 어떻게 셀링할지 참고하기 위해 Motivation & Purposedisease/trait와 CNV 연관성이 GWAS로 체계적으로 조사되지않았다. 정확한 도구의 부족으로ensemble CNV를 제안한다.eliminate batch effectassemble individual CNV calls into CNV regions from multiple existing callers(PennCNv, QuantiSNP, iPattern)re-genotypes each CNVR with local likelihood modelrefines CNVR boundariesprovides.. Genomic Language Models: Opportunities and Challenges https://arxiv.org/abs/2407.11435 Genomic Language Models: Opportunities and ChallengesLarge language models (LLMs) are having transformative impacts across a wide range of scientific fields, particularly in the biomedical sciences. Just as the goal of Natural Language Processing is to understand sequences of words, a major objective in biolarxiv.org 저널 클럽용이지만, 관심있는 분야(VEP)의 LLM 모델 리뷰 논문으로써 연구에 참.. ECOLE: Learning to call copy number variants on whole exome sequencing data https://www.nature.com/articles/s41467-023-44116-y#Sec15내가 사용하는 tool merge 알고리즘이 좋다는 것을 어떤식으로 연구하면 좋을지 참고하기 위함 Motivation & Purpose정확한 WEG 데이터에서 CNV 지역을 찾는 것은 오랜 관심사였고 알고리즘이 계속 개발되고 향상되어왔으나전문가가 큐레이션한 골드 스탠다드 데이터에서 낮은 정밀도(precision)와 재현율(recall)을 보이는 문제가 있다. NovelityTransformer architecture,1. WGS 샘플에서 생성된 높은 신뢰도의 호출 데이터 사용2. 소규모의 전문가 호출 데이터 세트 활용 via transfer learning3. 전문가가 레이블링한 데이터에서 성능 평가fi.. 4장 기본 그래프 신경망 4장에서는 [Scarselli et al.,, 2009]에 소개된 모델을 대표로 설명한다. 그래프 신경망 입문그래프 신경망은 최근 딥러닝의 어떤 분야보다도 빠르게 성장하고 있으며 많은 기업에서 이미 서비스에 적용했다. 이 책은 국내에서 그래프 신경망을 전문적으로 소개하는 첫 책이다. 20개 이상www.aladin.co.kr Chater 1. 서론 & Chater 2. 수학 및 그래프 기초 Introduction to Graph Neural Networks에이콘출판주식회사발행 2022년 4월 29일지은이 즈위안 리우/지에 저우옮긴이 정지수 이 카테고리는 '그래프 신경망 입문' 책 내용을 요약하고 추가로 내가 공부한 내용을 정리하는 공간이다.번역본이고 얇은 책인 만큼 1월 안에 다 읽어보려고한다.drug repurposing 주제로 GCN 모델을 사용하면서 좀더 체계적인 틀을 만들고 싶어서, 이 책을 선택하게되었다. 목표는 1. GCN 동작 원리를 암기한다. 이미 여러 차례 이해한 바가 있으나 계속 휘발되어서, 암기로 목표로 잡았다.2. GCN 코드를 이해할 수 있다. base model 을 실습하고 이해할 수 있는 back ground가 될 수 있었으면 한다.3. GCN의 역사(여러 모델).. 이전 1 2 3 4 ··· 9 다음