본문 바로가기
나노포어 논문/국내논문 정리

[생공연-김용민 박사님] PacBio와 Nanopore를 이용한 무궁화 다배체 유전체 조립 및 주석 연구

by youngmun 2025. 12. 31.

Two long read-based genome assembly and annotation of polyploidy woody plants, Hibiscus syriacus L. using PacBio and Nanopore platforms

 

무궁화 유전체는 얼마나 복잡할까요? - PacBio와 Nanopore로 완성한 다배체 목본식물 유전체 조립 연구

 

무궁화(Hibiscus syriacus L.)는 대한민국의 국화이자 대표적인 다배체(polyploid) 목본식물입니다.

그러나 무궁화는

  • 높은 반복서열 비율
  • 다배체 구조
  • 큰 유전체 크기

때문에, 그동안 고품질 유전체 조립(genome assembly)이 매우 어려운 식물로 알려져 왔습니다.

 

이번에 소개할 논문은 PacBio와 Oxford Nanopore 두 가지 long-read sequencing 플랫폼을 활용해 무궁화 유전체를 성공적으로 조립·비교·주석(annotation)한 연구입니다.

왜 무궁화 유전체 조립이 어려울까요?

무궁화는 단순한 모델 식물이 아닙니다.

  • 다배체(polyploidy)
    → 유사한 염색체와 유전자 복제본이 다수 존재
  • 목본식물(woody plant)
    → 반복서열과 전이인자 비율이 매우 높음
  • heterozygosity
    → 유전체 내 변이가 많음

이러한 특징 때문에 short-read 기반 assembly로는

  • contig이 잘게 쪼개지고
  • 유전자 중복 구분이 어려우며
  • 구조적 정보가 손실되기 쉽습니다.

이 연구의 핵심 접근 전략

 

본 연구의 가장 큰 특징은 PacBio와 Oxford Nanopore를 각각 사용하여 동일 종의 유전체를 독립적으로 조립하고 비교했다는 점입니다.

 

사용된 플랫폼

  • PacBio sequencing
  • Oxford Nanopore long-read sequencing

두 플랫폼 모두:

  • 긴 read 길이
  • 반복서열 관통 가능
  • 구조 변이 및 유전자 중복 구분에 유리

이라는 공통점을 가지지만, read 특성과 오류 패턴은 서로 다릅니다.


PacBio vs Nanopore 기반 assembly 비교

연구진은 두 플랫폼을 통해 얻은 결과를 다음과 같은 관점에서 비교하였습니다.

  • 전체 유전체 크기
  • contig 수 및 contig N50
  • BUSCO 완성도
  • 반복서열 및 전이인자 구성
  • 유전자 예측 및 주석 결과

그 결과,

  • 두 플랫폼 모두 다배체 무궁화 유전체를 안정적으로 조립 가능
  • long-read 기반 assembly가 다배체·반복서열 식물에서 필수적임을 확인
  • 플랫폼 간 차이는 존재하지만,유전체 구조와 유전자 정보는 전반적으로 일관성 있게 재현 되었음을 보여주었습니다.

유전자 예측과 annotation 결과

assembly 이후, RNA-seq 데이터와 ab initio 예측을 결합하여 무궁화 유전자 annotation을 수행하였습니다.

그 결과:

  • 다수의 단백질 코딩 유전자 예측
  • 전이인자(TE) 및 반복서열의 높은 비율 확인
  • 무궁화의 생장, 개화, 스트레스 반응과 관련된 유전자 군 확인
특히 다배체 특성으로 인해 유전자 복제본(paralog, homeolog)이 광범위하게 존재함을 명확히 보여주었습니다.

이 연구의 의미

이 논문은 단순히 “무궁화 유전체를 하나 만들었다”는 연구가 아닙니다.

다음과 같은 중요한 의미를 가집니다.

  1. 다배체 목본식물에서도 long-read 기반 assembly는 충분히 실용적
  2. PacBio와 Nanopore 모두
    고품질 식물 유전체 조립에 활용 가능
  3. 복잡한 식물 유전체 연구에서
    플랫폼 선택 시 고려해야 할 기준을 제시
  4. 무궁화를 포함한
    Malvaceae 식물 연구 및 분자육종의 기반 자료 제공

왜 이 연구가 중요한가요?

식물 유전체 연구는 이제 단순한 모델 식물을 넘어,

  • 다배체
  • 목본식물
  • 반복서열이 많은 유전체로 확장되고 있습니다.
이 연구는 “long-read sequencing 없이는 현대 식물 유전체 연구가 어렵다”는 점을 무궁화라는 상징적인 식물을 통해 명확히 보여줍니다.

요약

본 연구는 PacBio와 Oxford Nanopore long-read sequencing을 이용해 다배체 목본식물인 무궁화 유전체를 성공적으로 조립·비교·주석함으로써, 복잡한 식물 유전체 연구에서 long-read 기반 접근의 필수성을 입증한 논문입니다.
https://www.nature.com/articles/s41597-023-02631-z