본문 바로가기
나노포어 논문/Microbiology

Hybrid 없이도 충분하다: Nanopore Long-Read Only Assembly의 임상 적용 검증 (92개 임상 균주 대규모 연구)

by youngmun 2026. 3. 10.

Nanopore long-read-only genome assembly 

of clinical Enterobacterales isolates is complete and accurate

 

Nanopore Long-read Only Assembly, 이제 Hybrid 없이도 충분할까? – 92개 임상 Enterobacterales 균주 대규모 벤치마킹 연구

 

2026년 Microbial Genomics에 게재된 본 연구는 Oxford Nanopore의 최신 chemistry(R10.4.1)와 Dorado super-high accuracy 모델을 활용하여 long-read only assembly가 hybrid assembly(ONT + Illumina)를 대체할 수 있는지를 대규모 임상 샘플에서 평가한 연구입니다.


연구 배경

기존에는 Nanopore read의 오류율 때문에 정확한 bacterial genome assembly를 위해서는 Illumina short-read와의 hybrid assembly가 필수적이었습니다.

 

하지만 최근:

  • R10.4.1 flow cell
  • Kit 14 chemistry
  • Dorado v5 super-high accuracy basecalling

기술 발전으로 long-read 정확도가 크게 향상되었습니다.

그렇다면 과연, "이제 hybrid 없이 long-read only로도 임상 감시(surveillance)에 충분할까?"

이 질문을 해결하기 위해 연구진은 92개의 실제 임상 Enterobacterales 균주를 분석했습니다.

연구 설계

샘플

  • 영국 국가 감시 프로그램에서 수집된
  • 92개 임상 Enterobacterales 균주
    • 대부분 E. coli, Klebsiella spp.

시퀀싱

  • ONT PromethION P2 Solo (R10.4.1)
  • Illumina NovaSeq (2×150bp)

비교 대상 Assembly 조합

Long-read only:
  • Flye
  • Hybracter (long)
  • Autocycler (consensus assembler)
Hybrid:
  • Hybracter (hybrid)
  • Unicycler (normal / bold)

Polishing:
  • Medaka (long-read polishing)
  • Polypolish + Pypolca
    (short-read polishing)


주요 결과

1. 염색체 완성도 (Chromosome circularisation)

Autocycler가 가장 우수했습니다.

  • Autocycler: 95% (87/92) chromosome circularisation
  • Unicycler: 80%
  • Hybrid Hybracter: 86%
즉, Long-read consensus assembler인 Autocycler가 hybrid보다 오히려 더 높은 구조적 완성도를 보였습니다.
  Assembler
  Autocycler
n (%)
Flye
n (%)
Hybracter (long)
n (%)
Hybracter (hybrid)
n (%)
Unicycler
n (%)
Unicycler (bold)
n (%)
P-value‡
Chromosomes circularised (N=92) 87
(94.6%)
78
(84.8%)
80
(87.0%)
79
(85.9%)
74
(80.4%)
78
(84.8%)
<0.0001
Present* plasmids (N=278) 267
(96%)
156
(56.1%)
268
(96.4%)
278
(100%)
266
(95.7%)
258
(92.8%)
0.002
Misassembled† plasmids (N=278)            
 Non-circular 0 (0%) 16 (5.8%) 2 (0.7%) 0 (0%) 4 (1.4%) 2 (0.7%)  
 Length mismatch 1 (0.4%) 41 (14.7%) 1 (0.4%) 0 (0%) 1 (0.4%) 1 (0.4%)  
 Mash distance >0.025 0 (0%) 1 (0.4%) 0 (0%) 0 (0%) 0 (0%) 0 (0%)  
 Non-circular and
    length mismatch
0 (0%) 17 (6.1%) 2 (0.7%) 0 (0%) 3 (1.1%) 6 (2.2%)  
Absent plasmids (N=278) 10 (3.6%) 47 (16.9%) 5 (1.8%) 0 (0%) 4 (1.4%) 11 (4%)  

 

2. Plasmid 복원 능력

Plasmid reconstruction은 공중보건 감시에서 매우 중요합니다 (AMR 전파와 직결).

결과:

  • Flye는 plasmid 복원율이 낮음 (~56%)
  • Autocycler, Hybracter, Unicycler는 90–96% 수준
  • Hybrid와 큰 차이 없음
즉, Autocycler 기반 long-read only assembly는 plasmid 복원에서도 hybrid와 거의 동등 
특히 Flye 단독 사용은 small plasmid (<10kb)에서 취약한 것으로 확인되었습니다.

 

 

 

3. 염기 수준 정확도 (SNV / Indel / QV)

가장 중요한 결과입니다.

Autocycler + Medaka 조합의 성능:

  • Median 0 SNVs
  • Median 0 indels
  • QV ≈ 100
  • 92개 중 4개만 >10개 error 존재
Short-read polishing이 약간 더 정확하긴 했지만, 그 차이는 매우 작고 일부 isolate에만 해당되었습니다.
즉, Long-read only assembly도 사실상 hybrid에 근접한 정확도 달성

 

4. MLST / AMR / Virulence gene annotation

놀랍게도:

  • MLST 결과 완전 일치
  • AMR gene annotation 차이 없음
  • Virulence gene 차이 없음
  • Stress gene annotation 차이 없음
실제 surveillance에 필요한 핵심 정보에서는 Long-read only와 hybrid 간 차이가 없었습니다.

연구의 의미

이 연구는 다음을 보여줍니다:

  • Nanopore long-read only assembly는
    • 구조적으로 완전하며
    • plasmid reconstruction이 가능하고
    • hybrid에 근접한 정확도를 제공하며
    • AMR surveillance에 충분히 사용 가능하다
  • Autocycler는 매우 강력한 옵션
    • Consensus 기반 접근이 stochastic variation을 줄여줌

한계점

  • “Ground truth” reference genome이 없음
  • Autocycler는 계산 자원이 많이 필요 (13,428 CPUh)
  • 다른 bacterial species로의 일반화는 제한적

결론

Nanopore long-read only assembly는 이제 단순 연구 목적이 아니라 실제 공중보건 감시(public health genomics)에 적용 가능한 수준이다.

특히 Autocycler + Medaka 조합은 hybrid assembly를 대체할 수 있는 현실적인 대안으로 제시되었습니다.

이 연구는 다음과 같은 고객에게 특히 유용합니다:

  • 국가 감시 프로그램
  • AMR surveillance 연구실
  • plasmid epidemiology 연구자
  • 비용 및 workflow 단순화를 원하는 기관

Hybrid sequencing 없이도:

  • 비용 절감
  • workflow 단순화
  • 실시간 분석 가능
  • decentralised lab 구축 가능이라는 장점이 있습니다.

https://www.microbiologyresearch.org/content/journal/mgen/10.1099/mgen.0.001631