본문 바로가기
나노포어 논문/Microbiology

Nanopore로 1.25Gb 초복잡 유전체 해독: dinoflagellate genome 연구

by youngmun 2026. 3. 19.

Complex gene structures in Amphidinium carterae revealed through nanopore sequencing

Nanopore로 초복잡 해양 미생물 유전체 해독하기

(Amphidinium carterae genome 연구)

 

연구 개요

본 연구에서는 해양 미세조류인 dinoflagellate Amphidinium carterae의 매우 크고 복잡한 유전체를 Oxford Nanopore long-read 시퀀싱만으로 조립하고, 이를 기반으로 유전자 구조와 발현 특성을 분석하였습니다.

 

본 연구에서 분석한 Amphidinium carterae는 박테리아가 아닌 dinoflagellate에 속하는 단세포 진핵생물로, 해양 생태계에서 중요한 역할을 하는 미생물입니다.


연구 배경

Dinoflagellate 유전체는 다음과 같은 특징을 가집니다.

  • 매우 큰 유전체 크기
  • 높은 반복 서열 (repeat) 비율
  • 특이한 유전자 구조 (짧은 exon + 긴 intron)
  • tandem gene duplication 다수 존재
기존 short-read 기반 분석으로는 정확한 assembly 및 annotation이 어려움

연구 목적

  • Nanopore long-read만으로 유전체 조립 가능성 평가
  • 복잡한 유전자 구조 및 반복 패턴 분석
  • tandem gene의 기능적 의미 규명

주요 결과

1) 유전체 조립 결과

  • 전체 크기: 약 1.25 Gb
  • contig 수: 2,478개
  • N50: 약 1.1 Mb
  • coverage: 약 60×
long-read 기반으로 고품질 assembly 확보

2) 반복 서열 비율

  • 55%가 반복 서열
매우 높은 repeat genome

3) 유전자 구조 특징

  • exon: 매우 짧음
  • intron: 매우 김
  • 일부 유전자:
    • intron 안에 다른 gene 존재 (nested gene)
기존 eukaryote와 매우 다른 구조
 
 
  이 그림은 A. carterae의 유전자 구조 특징을 보여준다. exon은 짧고 intron은 매우 긴 구조를 가지며, 일부 유전자에서는 intron 내부에 다른 유전자가 포함된 nested 구조가 관찰된다. 또한 동일한 유전자가 반복되는 tandem gene 구조도 확인되며, 이러한 반복 유전자는 높은 발현과 관련이 있다.  

 


4) tandem gene 특징

  • 68개 gene family 존재
  • copy number: 3 ~ 52개

핵심 특징:

  • 높은 유사성 유지
  • purifying selection (기능 유지)

5) gene expression

  • tandem gene:
    • 일반 gene보다 약 56배 높은 발현

copy number ↑ → expression ↑

dose-dependent regulation

 
 
  이 그림은 유전자 종류에 따른 발현 수준과, 반복 유전자(tandem gene)의 copy 수와 발현량 간의 관계를 보여준다. Tandem gene은 일반 유전자보다 높은 발현을 보이며, copy 수가 증가할수록 발현량도 함께 증가하는 경향을 나타낸다.  

 


6) 핵심 gene (MBNP)

  • 최대 52 copies
  • 매우 높은 발현
  • DNA 구조 유지에 중요한 역할

7) genome 전략 변화

기존: → “gene hoarder (무조건 축적)”

이번 연구: → “gene collector (선택적으로 유지)”


실험 방법

 
 
  이 그림은 Nanopore 시퀀싱 데이터를 이용하여 유전체를 조립하고 유전자를 분석하는 전체 과정을 보여준다. DNA를 시퀀싱한 후 basecalling을 통해 염기서열로 변환하고, 이를 기반으로 genome assembly를 수행한다. 이후 오염된 서열을 제거한 뒤, transcriptome 정보를 활용한 유전자 annotation과 반복 서열 분석, RNA 분석 등을 통해 최종적으로 유전체 구조를 해석한다.  

 

샘플 배양

  • Amphidinium carterae 배양
  • ESAW media + f/2 nutrient
  • 25°C, light/dark cycle 유지

DNA 추출 및 시퀀싱

  • Nanopore (PromethION + MinION) 사용
  • Dorado basecalling (SUP mode)

데이터 전처리

  • bacterial contamination 제거
  • control sequence 제거
  • read filtering 수행

Genome assembly

  • Flye de novo assembly 사용
  • contig filtering:
    • length ≥ 10 kb
    • coverage ≥ 30×

Annotation

여러 방법을 조합:

  • RNA-seq 기반 transcriptome
  • Trinity assembly
  • MAKER + Exonerate
  • BLAST 기반 검증
  • Apollo로 수동 annotation

특히:

  • tandem gene은 manual curation 수행

반복 서열 분석

  • RepeatMasker 사용

RNA 및 유전자 분석

  • Bowtie2 → read mapping
  • StringTie → expression 계산

선택압 분석

  • dN/dS 계산
  • RAxML phylogenetic 분석

핵심 해석

이 연구는 Nanopore long-read 시퀀싱이 매우 복잡한 eukaryotic genome에서도

  • repeat 구조 해결
  • gene duplication 구조 해석
  • expression 패턴 분석

이 가능함을 보여줍니다.


연구의 의미

  • 복잡한 해양 미생물 유전체 연구 가능
  • gene duplication 기반 조절 메커니즘 제시
  • future genome annotation 개선 방향 제시

한줄 요약

Nanopore long-read sequencing은 dinoflagellate와 같은 초복잡 유전체에서도 정확한 assembly와 유전자 구조 분석을 가능하게 하며, gene copy 수 기반 발현 조절 메커니즘을 밝혀냈다.

https://link.springer.com/article/10.1186/s12864-025-12184-7