본문 바로가기
공부자료

Oxford Nanopore EPI2ME로 보는 Dot Plot 분석

by youngmun 2026. 5. 20.

시퀀스 비교를 가장 직관적으로 시각화하는 방법

 

유전체 분석을 하다 보면 “두 서열이 얼마나 비슷한가?”, “구조적 변이가 존재하는가?”, “assembly 품질은 어떤가?” 같은 질문을 자주 하게 됩니다. 이럴 때 가장 직관적이면서도 강력한 시각화 방법 중 하나가 바로 Dot Plot (도트 플롯) 입니다. Oxford Nanopore의 EPI2ME 블로그에서도 Dot Plot을 활용한 시퀀스 비교 방법을 소개하고 있으며, long-read sequencing 시대에서 더욱 중요해지고 있는 분석 방식으로 주목받고 있습니다.


Dot Plot이란?

 

Dot Plot은 두 개의 서열(sequence)을 X축과 Y축에 배치한 뒤, 서로 일치하는 영역을 점(dot)으로 표시하는 시각화 방법입니다.

쉽게 말하면:

  • 두 서열이 비슷하면 → 대각선 형태
  • inversion이 있으면 → 반대 방향 대각선
  • duplication이 있으면 → 반복 패턴
  • deletion/insertion이 있으면 → 끊어진 패턴

처럼 나타납니다.

즉, 복잡한 alignment 결과를 한눈에 이해할 수 있게 해주는 매우 강력한 시각화 도구입니다.


왜 Long-read 시대에서 중요할까?

 

Oxford Nanopore sequencing은 초장읽기(long-read)를 생성하기 때문에:

  • 대규모 structural variation
  • 반복 영역(repetitive regions)
  • complex rearrangement
  • T2T assembly
  • chromosome-scale assembly

등을 분석하는 데 강력한 장점을 가지고 있습니다.

하지만 이런 복잡한 구조를 단순 variant table만으로 이해하기는 어렵습니다.

이때 Dot Plot은:

  • genome assembly 품질 확인
  • reference 대비 구조 비교
  • inversion/translocation 탐지
  • repeat structure 확인
  • haplotype 구조 분석

등에 매우 유용하게 활용됩니다.


Dot Plot 해석 방법

 

1. 완벽하게 일치하는 경우

가장 이상적인 경우입니다.

좌측 아래 → 우측 위로 이어지는 깔끔한 대각선이 나타납니다.

의미:

  • 두 서열이 거의 동일
  • assembly 품질 우수
  • 큰 structural variation 없음

2. Inversion 존재

대각선이 반대 방향으로 나타납니다.

즉:

↘ 방향이 아닌
↙ 방향 대각선

이 보이면 inversion 가능성을 의미합니다.

Nanopore long-read는 이런 inversion 검출에 특히 강력합니다.


3. Duplication / Repeat

특정 구간에서 여러 개의 평행선이 나타날 수 있습니다.

이는:

  • tandem repeat
  • segmental duplication
  • repetitive sequence

등을 의미할 수 있습니다.

Short-read 기반 분석에서는 보기 어려운 구조도 long-read에서는 명확히 확인 가능합니다.


4. Deletion / Insertion

대각선이 중간에서 끊기거나 이동된 형태를 보입니다.

이는:

  • insertion
  • deletion
  • structural rearrangement

가능성을 시사합니다.


EPI2ME에서의 활용

Oxford Nanopore의 EPI2ME 플랫폼은 다양한 분석 workflow를 제공하는 오픈 분석 플랫폼입니다.

특징:

  • GUI 기반 분석
  • Nextflow workflow 지원
  • 로컬/클라우드 실행 가능
  • 실시간 분석 지원
  • 초보자도 사용 가능

Dot Plot은 특히 다음 분야에서 많이 활용됩니다:

Genome Assembly

  • bacterial assembly
  • plasmid assembly
  • human genome assembly
  • T2T assembly

Structural Variant 분석

  • inversion
  • translocation
  • duplication
  • CNV

등의 구조를 시각적으로 확인 가능


Comparative Genomics

다른 strain 또는 reference genome과 비교 시 매우 유용합니다.

예:

  • pathogen 비교
  • microbial evolution
  • strain differentiation

Long-read sequencing과 Dot Plot의 시너지

Dot Plot은 원래 오래된 분석 기법이지만, long-read sequencing 시대에 다시 매우 중요한 도구가 되었습니다.

특히 ONT 데이터는:

  • ultra-long read
  • repetitive region spanning
  • telomere/centromere 분석
  • haplotype separation

등이 가능하기 때문에 Dot Plot의 정보량이 훨씬 풍부해집니다.

즉: “눈으로 genome structure를 이해하는 시대” 가 가능해진 것입니다.


실제 연구에서 활용되는 분야

현재 Dot Plot은 다음 연구에서 활발히 사용됩니다.

T2T Genome Assembly

  • assembly completeness 확인
  • chromosome continuity 검증

Cancer Genomics

  • fusion
  • rearrangement
  • chromothripsis

분석

Microbial Genomics

  • plasmid 구조 비교
  • antimicrobial resistance island 분석

Plant Genomics

  • polyploid genome 비교
  • repeat-rich genome 구조 분석

EPI2ME의 장점

Oxford Nanopore는 EPI2ME를 통해 bioinformatics 접근성을 크게 낮추고 있습니다.

장점:

  • 복잡한 설치 최소화
  • 오픈소스 workflow 제공
  • Windows/macOS/Linux 지원
  • Nextflow 기반 재현성 확보
  • interactive report 제공

특히 bioinformatics 경험이 적은 사용자도 쉽게 접근할 수 있다는 점이 큰 장점입니다.


마무리

Dot Plot은 단순한 그림이 아닙니다.

복잡한 유전체 구조를 한눈에 이해하게 해주는 매우 강력한 분석 도구입니다.

그리고 Oxford Nanopore long-read sequencing은 Dot Plot의 가치를 극대화합니다.

특히:

  • structural variation
  • T2T assembly
  • repeat region
  • complex rearrangement

같은 영역에서는 앞으로 더욱 중요해질 것으로 보입니다. 

Nanopore 데이터를 다루고 있다면, 단순 variant table만 보지 말고 꼭 Dot Plot visualization도 함께 확인해보는 것을 추천드립니다.


참고 링크