1. 정의
희소화 곡선(rearfaction curve)은 표본으로부터 추출한 개체의 단위에 따른 종의 수의 변화를 그래픽으로 표현한 것이다.
희소화 곡선은 주로 생태학과 생물다양성 연구에서 사용되며, 생태계나 생물군집에서 어떤 종이 발견되는지 이해하는 데 도움을 준다.
Rarefaction curve 은 N 개의 샘플 풀을 여러 번 무작위로 다시 샘플링한 다음 각 샘플에서 발견된 종의 평균 수(1,2, ...N)를 플로팅하여 생성됩니다. "따라서 희박화는 N 샘플 의 대규모 풀에서 무작위로 추출된 n 개인(또는 n 샘플) 의 소규모 컬렉션에서 예상되는 수의 종을 생성합니다 ." [2]
Rarefaction (ecology) - Wikipedia
From Wikipedia, the free encyclopedia Technique to assess species richness In ecology, rarefaction is a technique to assess species richness from the results of sampling. Rarefaction allows the calculation of species richness for a given number of individu
en.wikipedia.org
참조된 논문에 따르면, rarefaction curve 큰 범위인 Taxon sampling curves에 대해 이야기하고 있다.
cruve에는 4가지로 구분하고 있다. Individual-based VS sample-based / accumulation VS rarefaction
The individual-based accumulation curve shows one particular random ordering of all individuals pooled.
The individual-based rarefaction curve was computed by EstimateS using the Coleman method (Coleman 1981).
The sample-based accumulation curve shows one particular random ordering of all samples in the dataset.
The sample-based rarefaction curve was computed by repeated re-sampling, using EstimateS.
For both sample-based curves, the patchiness parameter in EstimateS set to 0.8, to emphasize the effect of spatial aggregation.
- Individual-based accumulation curve: 이 곡선은 개체 중심(Individual-based) 평가 프로토콜을 사용하여 모든 개체를 임의로 순서대로 조사한 결과입니다. 곡선은 점점 더 많은 개체를 풀어가며(pooled, 합쳐가며) 종의 축적 수를 나타냅니다.
- Individual-based rarefaction curve: EstimateS 소프트웨어에서 Coleman 방법을 사용하여 계산된 개체 중심(Individual-based) 세금 샘플링 곡선입니다. 이는 모든 풀린 개체들에 대해 반복해서 재샘플링하여 계산된 평균값으로, 해당 축적 곡선에 대한 통계적 기대치를 나타냅니다.
- Sample-based accumulation curve: 이 곡선은 샘플 중심(Sample-based) 평가 프로토콜을 사용하여 데이터셋 내의 모든 샘플을 임의로 순서대로 조사한 결과입니다. 각각의 추가되는 샘플에서 종의 축적 수를 보여줍니다.
- Sample-based rarefaction curve: EstimateS 소프트웨어에서 반복 재샘플링을 사용하여 계산된 샘플 중심(Sample-based) 세금 샘플링 곡선입니다. 부분성 파라미터(patchiness parameter)가 0.8로 설정되었으며, 이것은 종들이 어떻게 분산되어 있는지 강조하기 위한 것입니다.
개체 중심(Individual-based) 방식 : 예를 들어, 하나의 접근 방식은 각 토지 내에서 임의로 일부 개별 나무를 조사하여 순차적으로 한 나무씩 종 식별 정보를 기록하는 것. (전체 토지의 taxon을 조사하기 위해 개별 나무를 조사하는 것)
샘플 중심(Sample-based) 평가 : 각 토지 내에서 사각형 구역(quadrat)들을 설정하고 각각 내부의 모든 나무 수와 식별 정보를 기록하며 추가로 조사되는 사각형들을 통해 전체 종 수를 축적 (
2. 특징
- 대체로 더 많은 개체를 추출함에 따라 종의 수가 증가한다.
- 표본의 총 종의 수를 추정하기 위해 사용된다.
3. 해석
- 만약 곡선이 평평해지기 시작한다면, 그것은 개체군의 대부분의 종들이 표본에서 관찰되었음을 시사한다.
- 만약 그 곡선이 계속 가파르게 상승한다면, 그것은 아직 발견되지 않은 더 많은 종들이 있다는 것을 암시한다.
- 이를 통해 샘플에서 발견되지 않은 추가적인 종이 존재할 가능성을 추정할 수 있다.
4. 그래프 그리기
4.1 데이터 준비
1. 먼저 전체 표본을 동일한 크기의 작은 하위 표본(예: 각각 100개)으로 나눈 다음
2. 각 하위 표본에 존재하는 다른 종의 수를 셉니다.
3. 하위 표본이 표본 크기의 증가 순서로 결합하여, 각 단계에서 관찰된 종의 수가 그래프에 표현된다.
4.2. 그리기
... 수정중
'Bioinfomatics > microbiome' 카테고리의 다른 글
[microbiome] EPI2ME workflow (0) | 2022.08.24 |
---|---|
[microbiome] long-read seq(nanopore, MinION) 16S rRNA analysis (진행중) (0) | 2022.08.23 |
short-read metagenomics - step4. Taxonomic classification (0) | 2022.07.13 |
short-read metagenomics - step3. contig binning (0) | 2022.07.13 |
short-read metagenomics - step2. gene prediction (0) | 2022.07.13 |