Decomposing a San Francisco estuary microbiome using longread metagenomics reveals species- and strain-level dominance from picoeukaryotes to viruses
Nanopore 기반 메타게놈으로 해양 미생물 전체 해부하기
연구 개요
본 연구에서는 Nanopore 기반 long-read metagenomics를 이용하여 샌프란시스코 만(San Francisco Estuary)의 미생물 군집을 종 및 strain 수준까지 분해(decomposition)하고, 전체 생물 다양성을 정량적으로 분석하였습니다.
![]() |
| 이 그림은 샘플 수집부터 데이터 분석까지 전체 실험 흐름을 보여준다. (A)는 샘플 채취 위치를, (B)는 수질 샘플 처리와 DNA 추출 과정을, (C)는 Nanopore 시퀀싱 이후 데이터 처리 및 binning 분석 과정을 나타낸다. |
연구 목적
복잡한 환경 시료에서 미생물, 바이러스, 진핵생물까지 포함한 전체 메타게놈을 최대한 완전한 유전체 수준으로 재구성하고, 필요한 시퀀싱 깊이와 분석 방법을 평가하고자 하였습니다.
주요 결과
미생물 다양성
샘플에는 약 450~500종의 세균 및 고세균이 존재하는 것으로 추정되었습니다.
![]() |
| 이 그림은 세균과 고세균의 SSU 유전자를 기반으로 한 계통도를 보여준다. 바깥쪽 원은 동일 contig 내 SSU 존재 여부를, 그 다음은 분류군(phylum), 그리고 색상은 해당 contig의 abundance(coverage)를 나타낸다. 파란 점은 고품질 유전체가 확보된 경우를 의미한다. |
유전체 복원
총 68개의 고품질 유전체(>90% complete)를 확보하였으며, 일부는 거의 완전한 형태로 재구성되었습니다.
바이러스 다양성
약 4만 개 이상의 바이러스 population이 검출되었으며, 전체 contig의 약 40%를 차지하는 매우 높은 비율을 보였습니다.
- 바이러스 길이 분포 확인
- 일부는 1 Mb 이상의 giant virus
![]() |
| 이 그림은 동일한 16S 서열을 가진 두 유전체를 비교한 결과로, 전체 유전체 정렬에서는 차이가 나타나 서로 다른 strain임을 보여준다. 두 유전체는 약 98% 완성도를 가지며, 이러한 차이는 단순한 시퀀싱 오류가 아닌 실제 유전적 차이를 의미한다. |
생물 구성 비율
- 바이러스: ~40%
- 세균: ~38%
- 진핵생물: ~4%
- 고세균: <1%
→ 바이러스가 매우 큰 비중 차지

소수 strain 지배 구조
전체 다양성은 높지만 실제 abundance는
→ 소수 strain이 대부분을 차지하는 구조를 보였습니다.
plasmid 존재
약 1,900개 이상의 plasmid가 검출되었으며, 미생물 유전체 대비 약 3:1 비율로 존재하였습니다.
시퀀싱 깊이 한계
현재 150 Gb 데이터로도 모든 유전체를 완전히 분리하기 어려웠으며
→ 약 1 Tb 수준의 시퀀싱 필요로 제시되었습니다.
실험 방법
샘플 수집
샌프란시스코 만에서 10 L 표층수를 채취하여 미생물 시료를 확보하였습니다.
전처리 및 필터링
11 μm pre-filter 후 0.1 μm 필터를 사용하여 미생물 및 바이러스를 포함한 시료를 농축하였습니다.
DNA 추출
고분자 DNA 확보를 위해 bead 기반 방법과 효소 처리 방법을 이용하여 high molecular weight DNA를 추출하였습니다.
Nanopore 시퀀싱
총 약 150 Gb long-read 데이터를 생성하였으며, MinION과 PromethION을 사용하여 시퀀싱을 수행하였습니다.
데이터 분석
Assembly
- Flye를 이용한 metagenome assembly 수행
Binning
- GraphMB + 자체 refinement 방법 적용
Taxonomy 분석
- MMseqs2, Kaiju, geNomad 활용
바이러스 분석
- geNomad를 이용해 viral contig 및 population 분석 수행
핵심 해석
Nanopore long-read sequencing은 복잡한 환경 메타게놈에서도 높은 해상도로 유전체를 복원할 수 있지만, 모든 종을 완전히 분해하기 위해서는 매우 높은 시퀀싱 깊이가 필요함을 확인하였습니다.
연구의 의미
본 연구는 환경 미생물 군집을 단순한 “종 목록”이 아니라
→ 유전체 수준에서 이해할 수 있는 가능성을 보여주었으며, 향후 기후 변화 및 생태계 연구에 중요한 기반 데이터를 제공합니다.
한줄 요약
Nanopore 기반 메타게놈 분석을 통해 해양 환경에서 수백 종의 미생물과 수만 개의 바이러스가 존재하며, 이를 완전히 이해하려면 매우 높은 시퀀싱 깊이가 필요함을 확인하였습니다.
https://pmc.ncbi.nlm.nih.gov/articles/PMC11406994/
'나노포어 논문 > Microbiology' 카테고리의 다른 글
| Nanopore로 1.25Gb 초복잡 유전체 해독: dinoflagellate genome 연구 (0) | 2026.03.19 |
|---|---|
| Nanopore 메타지노믹스로 본 해양 생태계의 새로운 지도 (0) | 2026.03.18 |
| Hybrid 없이도 충분하다: Nanopore Long-Read Only Assembly의 임상 적용 검증 (92개 임상 균주 대규모 연구) (0) | 2026.03.10 |
| 나이지리아에서 직접 MinION으로 세균 동정과 항생제 내성 분석하기 (0) | 2026.02.24 |
| Long read 메타지놈으로 본 장내 phage의 장기 동역학 (0) | 2026.01.22 |


