본문 바로가기
나노포어 최신 동향

MethPhaser: 메틸화 기반의 장편 시퀀싱 Haplotype 분석 도구

by youngmun 2025. 3. 31.

MethPhaser: methylation-based long-read haplotype phasing of human genomes

메틸화 기반 장편 시퀀싱을 활용한 인간 유전체의 Haplotype 분석: MethPhaser의 개발 및 응용

 

  1. 서론
    유전체 내 유전 변이를 haplotype 단위로 구분하는 phasing은 돌연변이의 유전 방식, 표현형의 다양성, 유전자 간 상호작용 등을 규명하는 데 필수적인 분석 절차이다. 최근 Oxford Nanopore Technologies(ONT)와 같은 장편 시퀀싱 기술의 발전으로 phasing의 정확도는 향상되고 있으나, 여전히 긴 동형접합 구간 및 리드 길이의 제한 등으로 인해 한계가 존재한다. 특히 단일염기다형성(SNV)에 기반한 기존 phasing 기법은 비정형적 구조 변이나 조직 특이적 조절 신호 등을 충분히 반영하지 못한다.

  2. 방법
    본 연구에서는 ONT 장편 시퀀싱 기술로부터 획득 가능한 DNA 메틸화 시그널을 활용하여 phasing 정확도를 개선하는 새로운 분석 도구인 MethPhaser를 개발하였다. MethPhaser는 기존의 SNV 기반 phasing 알고리즘에 메틸화 정보를 통합함으로써 haplotype 특이적인 epigenetic 패턴을 인식하고, 이를 기반으로 더 긴 phase block을 구성할 수 있도록 설계되었다.

    평가를 위해 ONT R9 및 R10 플랫폼의 세포주 데이터를 사용하였고, 조직 샘플에 대해서도 실험 적용을 수행하였다.

  3. 결과
    MethPhaser는 기존의 SNV-only 기반 phasing 대비 다음과 같은 성능 향상을 보였다:
    ● Phase block N50 길이 증가: 기존 대비 78% ~ 151% 향상
    Phasing 정확도: 83.4% ~ 98.7% 달성
    HLA 및 임상 관련 유전자에서도 적용 가능성 확인
    혈액 샘플 등 실제 조직에서도 개선된 성능 유지, 조직 순도 및 무작위 메틸화 노이즈에 대한 내성 입증

    또한, 메틸화 기반 phasing은 기존 분석에서 구분되지 않았던 monoallelic expression을 구분하는 데도 기여하였다.

  4. 결론
    MethPhaser는 장편 시퀀싱 데이터를 기반으로 DNA 메틸화 시그널을 활용한 고정확도 haplotype phasing 도구로, 기존의 SNV 기반 방법을 능가하는 성능을 보였다. 특히 HLA 유전자와 같이 유전 다형성이 높은 영역에서도 적용 가능성이 높으며, 다양한 질병 표현형 및 구조 변이 분석에 폭넓게 활용될 수 있다. 향후 MethPhaser는 인간 유전체를 넘어 비인간 이배체 생물체의 phasing 분석에도 적용 가능한 범용적 분석 프레임워크로서 발전할 수 있을 것으로 기대된다.

 

https://github.com/treangenlab/methphaser