본문 바로가기

Bioinfomatics/microbiome

[CONCEPT] Rarefraction curve

1. 정의

희소화 곡선(rearfaction curve)은 표본으로부터 추출한 개체의 단위에 따른 종의 수의 변화를 그래픽으로 표현한 것이다.

희소화 곡선은 주로 생태학과 생물다양성 연구에서 사용되며, 생태계나 생물군집에서 어떤 종이 발견되는지 이해하는 데 도움을 준다.

 

Rarefaction curve 은 N 개의 샘플 풀을 여러 번 무작위로 다시 샘플링한 다음 각 샘플에서 발견된 종의 평균 수(1,2, ...N)를 플로팅하여 생성됩니다. "따라서 희박화는 N 샘플 의 대규모 풀에서 무작위로 추출된 n 개인(또는 n 샘플) 의 소규모 컬렉션에서 예상되는 수의 종을 생성합니다 ." [2]

 

Rarefaction (ecology) - Wikipedia

From Wikipedia, the free encyclopedia Technique to assess species richness In ecology, rarefaction is a technique to assess species richness from the results of sampling. Rarefaction allows the calculation of species richness for a given number of individu

en.wikipedia.org

참조된 논문에 따르면, rarefaction curve 큰 범위인 Taxon sampling curves에 대해 이야기하고 있다.

cruve에는 4가지로 구분하고 있다. Individual-based VS sample-based / accumulation VS rarefaction

The individual-based accumulation curve shows one particular random ordering of all individuals pooled. 

The individual-based rarefaction curve was computed by EstimateS using the Coleman method (Coleman 1981). 

The sample-based accumulation curve shows one particular random ordering of all samples in the dataset. 

The sample-based rarefaction curve was computed by repeated re-sampling, using EstimateS.

For both sample-based curves, the patchiness parameter in EstimateS set to 0.8, to emphasize the effect of spatial aggregation.

  1. Individual-based accumulation curve: 이 곡선은 개체 중심(Individual-based) 평가 프로토콜을 사용하여 모든 개체를 임의로 순서대로 조사한 결과입니다. 곡선은 점점 더 많은 개체를 풀어가며(pooled, 합쳐가며) 종의 축적 수를 나타냅니다.
  2. Individual-based rarefaction curve: EstimateS 소프트웨어에서 Coleman 방법을 사용하여 계산된 개체 중심(Individual-based) 세금 샘플링 곡선입니다. 이는 모든 풀린 개체들에 대해 반복해서 재샘플링하여 계산된 평균값으로, 해당 축적 곡선에 대한 통계적 기대치를 나타냅니다.
  3. Sample-based accumulation curve: 이 곡선은 샘플 중심(Sample-based) 평가 프로토콜을 사용하여 데이터셋 내의 모든 샘플을 임의로 순서대로 조사한 결과입니다. 각각의 추가되는 샘플에서 종의 축적 수를 보여줍니다.
  4. Sample-based rarefaction curve: EstimateS 소프트웨어에서 반복 재샘플링을 사용하여 계산된 샘플 중심(Sample-based) 세금 샘플링 곡선입니다. 부분성 파라미터(patchiness parameter)가 0.8로 설정되었으며, 이것은 종들이 어떻게 분산되어 있는지 강조하기 위한 것입니다.

개체 중심(Individual-based) 방식 : 예를 들어, 하나의 접근 방식은 각 토지 내에서 임의로 일부 개별 나무를 조사하여 순차적으로 한 나무씩 종 식별 정보를 기록하는 것. (전체 토지의 taxon을 조사하기 위해 개별 나무를 조사하는 것)

샘플 중심(Sample-based) 평가 : 각 토지 내에서 사각형 구역(quadrat)들을 설정하고 각각 내부의 모든 나무 수와 식별 정보를 기록하며 추가로 조사되는 사각형들을 통해 전체 종 수를 축적 (

 

2. 특징

- 대체로 더 많은 개체를 추출함에 따라 종의 수가 증가한다.

- 표본의 총 종의 수를 추정하기 위해 사용된다.

 

3. 해석

- 만약 곡선이 평평해지기 시작한다면, 그것은 개체군의 대부분의 종들이 표본에서 관찰되었음을 시사한다.

- 만약 그 곡선이 계속 가파르게 상승한다면, 그것은 아직 발견되지 않은 더 많은 종들이 있다는 것을 암시한다.

- 이를 통해 샘플에서 발견되지 않은 추가적인 종이 존재할 가능성을 추정할 수 있다.

(왼) 위키 (오) https://www.drive5.com/usearch/manual/rare.html

4. 그래프 그리기

4.1 데이터 준비

    1. 먼저 전체 표본을 동일한 크기의 작은 하위 표본(예: 각각 100개)으로 나눈 다음

    2. 각 하위 표본에 존재하는 다른 종의 수를 셉니다.

    3. 하위 표본이 표본 크기의 증가 순서로 결합하여, 각 단계에서 관찰된 종의 수가 그래프에 표현된다.

 

4.2. 그리기

 ... 수정중