나노포어 논문/Human WGS

1000 Genomes Project 샘플의 나노포어 시퀀싱을 통해 인간 유전적 변이의 포괄적 카탈로그 구축

youngmun 2025. 4. 1. 12:51

Nanopore sequencing of 1000 Genomes Project samples to build a comprehensive catalog of human genetic variation

1000 Genomes Project 샘플의 나노포어 시퀀싱을 통해 인간 유전적 변이의 포괄적 카탈로그 구축

 

배경

멘델 유전질환이 의심되는 환자의 절반 이상은 임상 유전체 검사를 거쳐도 정확한 분자 진단을 받지 못합니다. 최근 long-read sequencing (LRS)의 정확도 향상과 비용 감소로 인해 임상 유전체 분석에 LRS를 도입하려는 관심이 높아졌지만, 변이 필터링과 우선순위 지정에 활용할 수 있는 표준 제어 데이터셋의 부족은 여전히 주요한 장애물입니다.

 

연구 목표

이를 해결하기 위해 1000 Genomes Project ONT 시퀀싱 컨소시엄은 전체 1000명의 샘플 중 최소 800개에 대해 나노포어 기반 LRS 데이터를 생성하는 것을 목표로 하고 있습니다. 본 논문에서는 그 중 첫 100개 샘플에 대한 분석 결과를 보고합니다. 이들 샘플은 5개 초집단과 19개의 세부 집단을 대표합니다.

 

주요 결과

  • 평균 37× 커버리지, N50: 54 Kbp
  • 기존 연구와 높은 일치율을 보이며, 동형구간(homopolymer) 외의 SNV 및 인델 변이 정확히 식별
  • 샘플당 평균 24,543개의 고신뢰 구조 변이(SV) 탐지
    • 공유 SV 및 개인 고유 SV 포함
    • 질환 연관 반복 구간에서 병적 확장도 탐지 (short-read로는 불가능했던 영역)

또한 메틸화 시그니처 분석을 통해:

  • 임프린팅된 유전자 좌위의 예상 패턴
  • 비정상적인 X 염색체 불활성화(X-inactivation)
  • 새로운 차등 메틸화 영역(DMR) 등을 식별했습니다.

결론

이 연구는 임상 유전학 커뮤니티가 병적 SV를 발견하고 인간 유전체의 정상적인 변이 스펙트럼을 이해하는 데 도움이 되는 LRS 기반 참조 데이터를 제공합니다. 모든 시퀀싱 원자료와 통계는 공개되어 있어, 향후 임상 유전체 분석에서의 활용도가 높을 것으로 기대됩니다.