Nanopore long-read-only genome assembly
of clinical Enterobacterales isolates is complete and accurate
Nanopore Long-read Only Assembly, 이제 Hybrid 없이도 충분할까? – 92개 임상 Enterobacterales 균주 대규모 벤치마킹 연구
2026년 Microbial Genomics에 게재된 본 연구는 Oxford Nanopore의 최신 chemistry(R10.4.1)와 Dorado super-high accuracy 모델을 활용하여 long-read only assembly가 hybrid assembly(ONT + Illumina)를 대체할 수 있는지를 대규모 임상 샘플에서 평가한 연구입니다.
연구 배경
기존에는 Nanopore read의 오류율 때문에 정확한 bacterial genome assembly를 위해서는 Illumina short-read와의 hybrid assembly가 필수적이었습니다.
하지만 최근:
- R10.4.1 flow cell
- Kit 14 chemistry
- Dorado v5 super-high accuracy basecalling
기술 발전으로 long-read 정확도가 크게 향상되었습니다.
그렇다면 과연, "이제 hybrid 없이 long-read only로도 임상 감시(surveillance)에 충분할까?"
이 질문을 해결하기 위해 연구진은 92개의 실제 임상 Enterobacterales 균주를 분석했습니다.
연구 설계
샘플
- 영국 국가 감시 프로그램에서 수집된
- 92개 임상 Enterobacterales 균주
- 대부분 E. coli, Klebsiella spp.
시퀀싱
- ONT PromethION P2 Solo (R10.4.1)
- Illumina NovaSeq (2×150bp)
비교 대상 Assembly 조합
Long-read only:
|
Hybrid:
|
Polishing:
|

주요 결과
1. 염색체 완성도 (Chromosome circularisation)
Autocycler가 가장 우수했습니다.
- Autocycler: 95% (87/92) chromosome circularisation
- Unicycler: 80%
- Hybrid Hybracter: 86%
즉, Long-read consensus assembler인 Autocycler가 hybrid보다 오히려 더 높은 구조적 완성도를 보였습니다.
| Assembler | |||||||
| Autocycler n (%) |
Flye n (%) |
Hybracter (long) n (%) |
Hybracter (hybrid) n (%) |
Unicycler n (%) |
Unicycler (bold) n (%) |
P-value‡ | |
| Chromosomes circularised (N=92) | 87 (94.6%) |
78 (84.8%) |
80 (87.0%) |
79 (85.9%) |
74 (80.4%) |
78 (84.8%) |
<0.0001 |
| Present* plasmids (N=278) | 267 (96%) |
156 (56.1%) |
268 (96.4%) |
278 (100%) |
266 (95.7%) |
258 (92.8%) |
0.002 |
| Misassembled† plasmids (N=278) | |||||||
| Non-circular | 0 (0%) | 16 (5.8%) | 2 (0.7%) | 0 (0%) | 4 (1.4%) | 2 (0.7%) | |
| Length mismatch | 1 (0.4%) | 41 (14.7%) | 1 (0.4%) | 0 (0%) | 1 (0.4%) | 1 (0.4%) | |
| Mash distance >0.025 | 0 (0%) | 1 (0.4%) | 0 (0%) | 0 (0%) | 0 (0%) | 0 (0%) | |
| Non-circular and length mismatch |
0 (0%) | 17 (6.1%) | 2 (0.7%) | 0 (0%) | 3 (1.1%) | 6 (2.2%) | |
| Absent plasmids (N=278) | 10 (3.6%) | 47 (16.9%) | 5 (1.8%) | 0 (0%) | 4 (1.4%) | 11 (4%) | |
2. Plasmid 복원 능력
Plasmid reconstruction은 공중보건 감시에서 매우 중요합니다 (AMR 전파와 직결).
결과:
- Flye는 plasmid 복원율이 낮음 (~56%)
- Autocycler, Hybracter, Unicycler는 90–96% 수준
- Hybrid와 큰 차이 없음
즉, Autocycler 기반 long-read only assembly는 plasmid 복원에서도 hybrid와 거의 동등
특히 Flye 단독 사용은 small plasmid (<10kb)에서 취약한 것으로 확인되었습니다.

3. 염기 수준 정확도 (SNV / Indel / QV)
가장 중요한 결과입니다.
Autocycler + Medaka 조합의 성능:
- Median 0 SNVs
- Median 0 indels
- QV ≈ 100
- 92개 중 4개만 >10개 error 존재
Short-read polishing이 약간 더 정확하긴 했지만, 그 차이는 매우 작고 일부 isolate에만 해당되었습니다.
즉, Long-read only assembly도 사실상 hybrid에 근접한 정확도 달성

4. MLST / AMR / Virulence gene annotation
놀랍게도:
- MLST 결과 완전 일치
- AMR gene annotation 차이 없음
- Virulence gene 차이 없음
- Stress gene annotation 차이 없음
실제 surveillance에 필요한 핵심 정보에서는 Long-read only와 hybrid 간 차이가 없었습니다.
연구의 의미
이 연구는 다음을 보여줍니다:
- Nanopore long-read only assembly는
- 구조적으로 완전하며
- plasmid reconstruction이 가능하고
- hybrid에 근접한 정확도를 제공하며
- AMR surveillance에 충분히 사용 가능하다
- Autocycler는 매우 강력한 옵션
- Consensus 기반 접근이 stochastic variation을 줄여줌
한계점
- “Ground truth” reference genome이 없음
- Autocycler는 계산 자원이 많이 필요 (13,428 CPUh)
- 다른 bacterial species로의 일반화는 제한적
결론
Nanopore long-read only assembly는 이제 단순 연구 목적이 아니라 실제 공중보건 감시(public health genomics)에 적용 가능한 수준이다.
특히 Autocycler + Medaka 조합은 hybrid assembly를 대체할 수 있는 현실적인 대안으로 제시되었습니다.
이 연구는 다음과 같은 고객에게 특히 유용합니다:
- 국가 감시 프로그램
- AMR surveillance 연구실
- plasmid epidemiology 연구자
- 비용 및 workflow 단순화를 원하는 기관
Hybrid sequencing 없이도:
- 비용 절감
- workflow 단순화
- 실시간 분석 가능
- decentralised lab 구축 가능이라는 장점이 있습니다.
https://www.microbiologyresearch.org/content/journal/mgen/10.1099/mgen.0.001631
'나노포어 논문 > Microbiology' 카테고리의 다른 글
| Nanopore 메타지노믹스로 본 해양 생태계의 새로운 지도 (0) | 2026.03.18 |
|---|---|
| Nanopore 메타게놈으로 밝혀낸 해양 미생물 500종과 4만 개 바이러스 (0) | 2026.03.18 |
| 나이지리아에서 직접 MinION으로 세균 동정과 항생제 내성 분석하기 (0) | 2026.02.24 |
| Long read 메타지놈으로 본 장내 phage의 장기 동역학 (0) | 2026.01.22 |
| 배양 없이 임질균 ‘내성’까지 찾는 방법: 타깃 농축 + Nanopore 시퀀싱 (0) | 2026.01.15 |