본문 바로가기
나노포어 분석/분석 도구

[분석/Somatic] lrsomatic — 롱리드 기반 암 체세포 변이(SNV·SV·CNV) 올인원 분석 파이프라인

by youngmun 2025. 12. 11.

lrsomatic — 롱리드 기반 암 체세포 변이 분석 파이프라인

 

lrsomatic은 롱리드 시퀀싱 데이터를 활용해 암 샘플의 체세포 변이(somatic mutation)를 한번에 분석할 수 있는 Nextflow 워크플로우입니다. 종양-정상 쌍 분석뿐 아니라 종양 단독(tumour-only) 분석도 지원하며, SNV/indel, 구조 변이(SV), 복제수 변이(CNV)까지 포괄적으로 처리합니다.


핵심 특징

 

롱리드 시퀀싱 지원: 롱리드 데이터를 모두 지원하여, 롱리드의 장점(복잡한 구조 변이 탐지 등)을 최대한 활용할 수 있습니다.

 

Matched vs Tumour-only 모드: 정상 샘플이 있는 경우는 matched tumour-normal로, 없는 경우는 tumour-only 모드로 분석할 수 있어 유연합니다.

 

다양한 변이 유형 분석

  • SNV / 작은 indel (Clair3, ClairS / ClairS-TO)
  • 구조 변이 (SV) (Severus)
  • 복제수 변이 (CNV) (ASCAT 기반)
  • (옵션) 변형 염기 분석 / Fiber-seq

Nextflow + 컨테이너 기반: Nextflow DSL2 구조로 작성되어 재현성·이식성이 높고, Docker/Singularity 환경에서 안정적으로 실행됩니다.


분석 흐름 요약

  1. 전처리 & QC: raw BAM 검토 및 QC, reference 정렬, 매핑 품질 검사
  2. SNV/indel 분석: 종양-정상 비교 또는 tumour-only 통계 기반 호출
  3. 구조 변이(SV) & CNV 분석: 큰 변이 및 복제수 이상 탐지
  4. 리포트 생성: MultiQC 종합 리포트 포함 결과 파일 생성


lrsomatic 장점

  • 롱리드 전용 somatic 파이프라인으로 end-to-end 분석 가능
  • Phasing 기반 SNV 정확도 향상
  • 정상 샘플 없이도 분석 지원
  • QC 리포트 포함 사용자 편의 강화

 

lrsomatic은 나노포어 롱리드 데이터를 활용해 암 샘플에서 체세포 변이(SNV/indel, SV, CNV)를 한 번에 분석해주는 Nextflow 기반 워크플로입니다.

https://github.com/IntGenomicsLab/lrsomatic