본문 바로가기
나노포어 논문/Microbiology

Nanopore 메타게놈으로 밝혀낸 해양 미생물 500종과 4만 개 바이러스

by youngmun 2026. 3. 18.

Decomposing a San Francisco estuary microbiome using longread metagenomics reveals species- and strain-level dominance from picoeukaryotes to viruses

Nanopore 기반 메타게놈으로 해양 미생물 전체 해부하기

 

연구 개요

본 연구에서는 Nanopore 기반 long-read metagenomics를 이용하여 샌프란시스코 만(San Francisco Estuary)의 미생물 군집을 종 및 strain 수준까지 분해(decomposition)하고, 전체 생물 다양성을 정량적으로 분석하였습니다.

이 그림은 샘플 수집부터 데이터 분석까지 전체 실험 흐름을 보여준다. (A)는 샘플 채취 위치를, (B)는 수질 샘플 처리와 DNA 추출 과정을, (C)는 Nanopore 시퀀싱 이후 데이터 처리 및 binning 분석 과정을 나타낸다.

연구 목적

복잡한 환경 시료에서 미생물, 바이러스, 진핵생물까지 포함한 전체 메타게놈을 최대한 완전한 유전체 수준으로 재구성하고, 필요한 시퀀싱 깊이와 분석 방법을 평가하고자 하였습니다.


주요 결과

미생물 다양성

샘플에는 약 450~500종의 세균 및 고세균이 존재하는 것으로 추정되었습니다.

이 그림은 세균과 고세균의 SSU 유전자를 기반으로 한 계통도를 보여준다. 바깥쪽 원은 동일 contig 내 SSU 존재 여부를, 그 다음은 분류군(phylum), 그리고 색상은 해당 contig의 abundance(coverage)를 나타낸다. 파란 점은 고품질 유전체가 확보된 경우를 의미한다.

유전체 복원

68개의 고품질 유전체(>90% complete)를 확보하였으며, 일부는 거의 완전한 형태로 재구성되었습니다.


바이러스 다양성

4만 개 이상의 바이러스 population이 검출되었으며, 전체 contig의 약 40%를 차지하는 매우 높은 비율을 보였습니다.

  • 바이러스 길이 분포 확인
  • 일부는 1 Mb 이상의 giant virus
이 그림은 동일한 16S 서열을 가진 두 유전체를 비교한 결과로, 전체 유전체 정렬에서는 차이가 나타나 서로 다른 strain임을 보여준다. 두 유전체는 약 98% 완성도를 가지며, 이러한 차이는 단순한 시퀀싱 오류가 아닌 실제 유전적 차이를 의미한다.

생물 구성 비율

  • 바이러스: ~40%
  • 세균: ~38%
  • 진핵생물: ~4%
  • 고세균: <1%

→ 바이러스가 매우 큰 비중 차지

이 그림은 다양한 분석 도구를 이용해 contig의 분류 결과를 보여준다. 전체적으로 바이러스와 세균이 주요 구성 요소를 이루며, 고세균은 상대적으로 적은 비율을 차지한다. 특히 Nitrosopumilus 관련 contig는 길이가 더 길고 조립 품질이 높게 나타난다. 진핵생물 분류는 일부 데이터베이스 제한으로 인해 미세 진핵생물 중심으로 분석되었다.


소수 strain 지배 구조

전체 다양성은 높지만 실제 abundance는
소수 strain이 대부분을 차지하는 구조를 보였습니다.

 

plasmid 존재
약 1,900개 이상의 plasmid가 검출되었으며, 미생물 유전체 대비 약 3:1 비율로 존재하였습니다.


시퀀싱 깊이 한계

현재 150 Gb 데이터로도 모든 유전체를 완전히 분리하기 어려웠으며
약 1 Tb 수준의 시퀀싱 필요로 제시되었습니다.


실험 방법

샘플 수집

샌프란시스코 만에서 10 L 표층수를 채취하여 미생물 시료를 확보하였습니다.


전처리 및 필터링

11 μm pre-filter 후 0.1 μm 필터를 사용하여 미생물 및 바이러스를 포함한 시료를 농축하였습니다.


DNA 추출

고분자 DNA 확보를 위해 bead 기반 방법과 효소 처리 방법을 이용하여 high molecular weight DNA를 추출하였습니다.


Nanopore 시퀀싱

총 약 150 Gb long-read 데이터를 생성하였으며, MinION과 PromethION을 사용하여 시퀀싱을 수행하였습니다.


데이터 분석

Assembly

  • Flye를 이용한 metagenome assembly 수행

Binning

  • GraphMB + 자체 refinement 방법 적용

Taxonomy 분석

  • MMseqs2, Kaiju, geNomad 활용

바이러스 분석

  • geNomad를 이용해 viral contig 및 population 분석 수행

핵심 해석

Nanopore long-read sequencing은 복잡한 환경 메타게놈에서도 높은 해상도로 유전체를 복원할 수 있지만, 모든 종을 완전히 분해하기 위해서는 매우 높은 시퀀싱 깊이가 필요함을 확인하였습니다.


연구의 의미

본 연구는 환경 미생물 군집을 단순한 “종 목록”이 아니라
유전체 수준에서 이해할 수 있는 가능성을 보여주었으며, 향후 기후 변화 및 생태계 연구에 중요한 기반 데이터를 제공합니다.


한줄 요약

Nanopore 기반 메타게놈 분석을 통해 해양 환경에서 수백 종의 미생물과 수만 개의 바이러스가 존재하며, 이를 완전히 이해하려면 매우 높은 시퀀싱 깊이가 필요함을 확인하였습니다.

https://pmc.ncbi.nlm.nih.gov/articles/PMC11406994/