시퀀스 비교를 가장 직관적으로 시각화하는 방법
유전체 분석을 하다 보면 “두 서열이 얼마나 비슷한가?”, “구조적 변이가 존재하는가?”, “assembly 품질은 어떤가?” 같은 질문을 자주 하게 됩니다. 이럴 때 가장 직관적이면서도 강력한 시각화 방법 중 하나가 바로 Dot Plot (도트 플롯) 입니다. Oxford Nanopore의 EPI2ME 블로그에서도 Dot Plot을 활용한 시퀀스 비교 방법을 소개하고 있으며, long-read sequencing 시대에서 더욱 중요해지고 있는 분석 방식으로 주목받고 있습니다.
Dot Plot이란?
Dot Plot은 두 개의 서열(sequence)을 X축과 Y축에 배치한 뒤, 서로 일치하는 영역을 점(dot)으로 표시하는 시각화 방법입니다.
쉽게 말하면:
- 두 서열이 비슷하면 → 대각선 형태
- inversion이 있으면 → 반대 방향 대각선
- duplication이 있으면 → 반복 패턴
- deletion/insertion이 있으면 → 끊어진 패턴
처럼 나타납니다.
즉, 복잡한 alignment 결과를 한눈에 이해할 수 있게 해주는 매우 강력한 시각화 도구입니다.
![]() |
![]() |
![]() |
![]() |
![]() |
왜 Long-read 시대에서 중요할까?
Oxford Nanopore sequencing은 초장읽기(long-read)를 생성하기 때문에:
- 대규모 structural variation
- 반복 영역(repetitive regions)
- complex rearrangement
- T2T assembly
- chromosome-scale assembly
등을 분석하는 데 강력한 장점을 가지고 있습니다.
하지만 이런 복잡한 구조를 단순 variant table만으로 이해하기는 어렵습니다.
이때 Dot Plot은:
- genome assembly 품질 확인
- reference 대비 구조 비교
- inversion/translocation 탐지
- repeat structure 확인
- haplotype 구조 분석
등에 매우 유용하게 활용됩니다.
Dot Plot 해석 방법
1. 완벽하게 일치하는 경우
가장 이상적인 경우입니다.
좌측 아래 → 우측 위로 이어지는 깔끔한 대각선이 나타납니다.
의미:
- 두 서열이 거의 동일
- assembly 품질 우수
- 큰 structural variation 없음
2. Inversion 존재
대각선이 반대 방향으로 나타납니다.
즉:
↘ 방향이 아닌
↙ 방향 대각선
이 보이면 inversion 가능성을 의미합니다.
Nanopore long-read는 이런 inversion 검출에 특히 강력합니다.
3. Duplication / Repeat
특정 구간에서 여러 개의 평행선이 나타날 수 있습니다.
이는:
- tandem repeat
- segmental duplication
- repetitive sequence
등을 의미할 수 있습니다.
Short-read 기반 분석에서는 보기 어려운 구조도 long-read에서는 명확히 확인 가능합니다.
4. Deletion / Insertion
대각선이 중간에서 끊기거나 이동된 형태를 보입니다.
이는:
- insertion
- deletion
- structural rearrangement
가능성을 시사합니다.
EPI2ME에서의 활용
Oxford Nanopore의 EPI2ME 플랫폼은 다양한 분석 workflow를 제공하는 오픈 분석 플랫폼입니다.
특징:
- GUI 기반 분석
- Nextflow workflow 지원
- 로컬/클라우드 실행 가능
- 실시간 분석 지원
- 초보자도 사용 가능
Dot Plot은 특히 다음 분야에서 많이 활용됩니다:
Genome Assembly
- bacterial assembly
- plasmid assembly
- human genome assembly
- T2T assembly
Structural Variant 분석
- inversion
- translocation
- duplication
- CNV
등의 구조를 시각적으로 확인 가능
Comparative Genomics
다른 strain 또는 reference genome과 비교 시 매우 유용합니다.
예:
- pathogen 비교
- microbial evolution
- strain differentiation
Long-read sequencing과 Dot Plot의 시너지
Dot Plot은 원래 오래된 분석 기법이지만, long-read sequencing 시대에 다시 매우 중요한 도구가 되었습니다.
특히 ONT 데이터는:
- ultra-long read
- repetitive region spanning
- telomere/centromere 분석
- haplotype separation
등이 가능하기 때문에 Dot Plot의 정보량이 훨씬 풍부해집니다.
즉: “눈으로 genome structure를 이해하는 시대” 가 가능해진 것입니다.
실제 연구에서 활용되는 분야
현재 Dot Plot은 다음 연구에서 활발히 사용됩니다.
T2T Genome Assembly
- assembly completeness 확인
- chromosome continuity 검증
Cancer Genomics
- fusion
- rearrangement
- chromothripsis
분석
Microbial Genomics
- plasmid 구조 비교
- antimicrobial resistance island 분석
Plant Genomics
- polyploid genome 비교
- repeat-rich genome 구조 분석
EPI2ME의 장점
Oxford Nanopore는 EPI2ME를 통해 bioinformatics 접근성을 크게 낮추고 있습니다.
장점:
- 복잡한 설치 최소화
- 오픈소스 workflow 제공
- Windows/macOS/Linux 지원
- Nextflow 기반 재현성 확보
- interactive report 제공
특히 bioinformatics 경험이 적은 사용자도 쉽게 접근할 수 있다는 점이 큰 장점입니다.
마무리
Dot Plot은 단순한 그림이 아닙니다.
복잡한 유전체 구조를 한눈에 이해하게 해주는 매우 강력한 분석 도구입니다.
그리고 Oxford Nanopore long-read sequencing은 Dot Plot의 가치를 극대화합니다.
특히:
- structural variation
- T2T assembly
- repeat region
- complex rearrangement
같은 영역에서는 앞으로 더욱 중요해질 것으로 보입니다.
Nanopore 데이터를 다루고 있다면, 단순 variant table만 보지 말고 꼭 Dot Plot visualization도 함께 확인해보는 것을 추천드립니다.
참고 링크
- EPI2ME Dot Plot article: EPI2ME Dot Plot Blog
- EPI2ME 플랫폼 소개: EPI2ME Overview
- EPI2ME 다운로드: EPI2ME Downloads
'공부자료' 카테고리의 다른 글
| Readfish란 무엇인가? 실시간 선택 시퀀싱 기술 완벽 분석 (0) | 2026.05.18 |
|---|---|
| Nanopore Read Until의 진화 – UNCALLED 논문 리뷰 (0) | 2026.05.18 |
| Nanopore Adaptive Sampling의 시작, Read Until 논문 리뷰 (0) | 2026.05.18 |
| 왜 아직도 희귀질환은 진단이 어려울까? (0) | 2026.04.16 |
| 희귀질환 유전체 분석의 새로운 가능성 (0) | 2026.02.27 |




