본문 바로가기
나노포어 논문/국내논문 정리

[서울대병원-채종희 교수님] 희귀질환에서 전장유전체(GS)는 어디까지 도움이 될까요?

by youngmun 2026. 1. 9.

Clinical utility of genome sequencing in rare diseases: lessons from a single-center study of 1,452 Korean families

희귀질환에서 전장유전체(GS)는 어디까지 도움이 될까요? - 단일기관 1,452개 한국 가족 코호트에서 얻은 임상적 교훈

 

본 논문은 서울대학교병원 단일기관에서 희귀 유전질환이 의심되지만 기존 검사로 진단이 되지 않았던 1,452개 한국 가족(총 3,317명)에게 전장유전체 분석(Genome Sequencing, GS)을 적용하고, 진단 성과(진단율)와 임상적 유용성(clinical utility)을 체계적으로 평가한 대규모 연구입니다.

 

특히 이 연구의 강점은 단순히 “몇 % 진단됐다”를 넘어서, 어떤 변이 유형이 실제로 추가 진단에 기여했는지, 그리고 진단이 치료/관리 변화로 이어졌는지까지 구체적으로 보여준다는 점입니다.


연구 설계 한눈에 보기

  • 연구 형태: 후향적(retrospective) 단일기관 연구
  • 대상: 1,452가족 / 3,317명(대부분 소아 환자 포함)
  • 특징: 모든 환자에서 HPO(Human Phenotype Ontology) 기반 표현형(phenotype) 정리 후, 16개 질환 카테고리로 분류 
  • 기존 검사 이력: 등록 환자들은 GS 이전에 최소 1회 이상 유전학적 검사를 시행했으며, 그중 73.4%는 패널 또는 엑솜(ES) 검사 경험이 있었습니다.

실험 방법 Methods

1) 환자 등록과 임상 정보 수집

  • IRB 승인 및 동의 획득 후 연구가 진행되었습니다.
  • 포함 기준(핵심):
    • 기존 검사 후에도 원인이 불명확한 희귀 유전질환 의심 환자
    • 완전한 GS 데이터
    • HPO 용어로 정리된 임상 정보
    • 분석 후 담당 임상의와의 post-analysis 논의 가능
  • 환자들은 2020년 6월~2024년 6월 기간에 임상 평가 및 HPO 기반 표현형 정리가 이루어졌습니다.

2) 시퀀싱 데이터 생성

  • 샘플: 말초혈액(peripheral blood)에서 gDNA 추출(QIAamp DNA Blood Mini Kit)
  • 라이브러리: Illumina TruSeq DNA PCR-free
  • 플랫폼: Illumina NovaSeq 6000, 150bp paired-end
  • 정렬: GRCh38 + 미토콘드리아 rCRS에 정렬

3) 변이 탐지 Variant calling

이 연구는 “GS”라고 해서 SNV만 보는 것이 아니라, 희귀질환 진단에 중요한 변이 유형을 폭넓게 커버하도록 설계되어 있습니다.

  • SNV/indel: GATK v4.2.14
  • 미토콘드리아 SNV/indel: Mutect2 v4.1.0.0
  • 구조변이(SV)·CNV·전좌/역위 등: MANTA v1.6.0 + 3bCNV(깊이 기반 in-house 도구)
  • 이수성(aneuploidy): DOC(depth-of-coverage) 기반
  • SMN1 결실(SMA 관련): SMA Finder
  • STR 반복 확장(45개 유전자): ExpansionHunter v5.0.0
  • Mobile element insertion: MELT v2.2.2
  • ROH(동형접합 구간): AutoMap v1.2

4) 변이 해석 및 결과 분류

  • 자동 해석: 3billion의 EVIDENCE 파이프라인으로 annotation/필터링/우선순위화
  • 빈도 기반 필터링: gnomAD, DGV 등 활용(빈도 기준으로 common variant 제거)
  • 병원성 분류: ACMG/AMP를 기반으로 한 커스터마이즈 프레임워크 적용
  • 표현형 매칭: HPO 기반 symptom similarity scoring으로 “환자 phenotype과 얼마나 맞는 변이인가”를 후처리에서 정교화
  • 최종 검토: 임상 유전 전문가가 수동 리뷰 후 리포팅
  • 검증: Sanger 또는 microarray 등 orthogonal test로 확인, 필요 시 가족 segregation도 수행
  • 결과 범주:
    • Diagnosis / Possible diagnosis / Undiagnosed로 구분(명확한 기준 제시)

5) (특이점) STR 확장은 Nanopore long-read로 검증

STR 반복 확장은 short-read 기반 호출만으로 애매한 경우가 있어, 이 연구에서는 일부 케이스에서 Nanopore Cas9-targeted sequencing(nCATS)으로 반복수(repeat count)를 검증했습니다.

  • 플랫폼: GridION 또는 MinION
  • 정렬: minimap2
  • repeat count 추정: Straglr

핵심 결과 Results

1) 진단율: “거의 절반”이 분자진단에 도달했습니다

  • 가족 기준 분자진단(병원성/가능 병원성 변이 기반): 46.2%
  • 세부 분류:
    • Diagnosed: 632가족(43.5%)
    • Possibly diagnosed: 40가족(2.8%)

2) 이미 패널/엑솜을 했던 환자에서도 GS는 추가 가치를 보였습니다

  • 전체 환자 중 73.4%가 GS 전에 패널 또는 엑솜 검사를 받은 경험이 있었고,
  • 그럼에도 불구하고 GS 진단율은
    • 기존 NGS(패널/엑솜) 경험군: 44.9%
    • 기존 NGS 경험이 없는 군: 50.7%
      로 보고되었습니다.

즉, “엑솜/패널에서 안 나온 케이스에서도 GS가 의미 있는 확률로 답을 주었다”는 점이 이 연구의 현실적인 메시지입니다. 


3) 어떤 질환군에서 진단율이 높았을까요?

질환 카테고리별 진단율 차이가 뚜렷했습니다.

  • 높았던 카테고리(대표):
    • 신경근육질환: 62.4% (123/197)
    • 신경/신경발달질환: 49.2% (339/689)
    • 종양 증후군: 65.2% (15/23, 표본은 작음)
    • 안과 질환: 62.5% (25/40, 표본은 작음)
  • 낮았던 카테고리(대표):
    • 청각/이과 질환: 20.0% (10/50)
    • 면역 질환: 22.0% (9/41)
    • 심혈관: 22.2% (4/18)
    • 내분비: 25.0% (4/16)

4) GS가 특히 강한 지점: “GS에서만 잡히는 변이”가 실제로 진단을 만들었습니다

진단된 변이 유형 분포는 다음과 같습니다.

  • SNV/indel: 78.7%
  • CNV: 15.4%
  • STR 확장: 3.4%
  • SV: 2.6%

그리고 중요한 포인트는,

  • 진단된 가족 중 14.6%(98/672)복잡 구조변이, 역위, 비코딩/딥인트론 변이 등 “GS가 아니면 잡기 어려운 변이” 때문에 GS가 사실상 필수였다고 보고했습니다.

또한 STR 확장 케이스 일부는 long-read로 확인이 필요했고, 실제로 9건(1.3%)에서 Nanopore nCATS로 STR 확장을 검증했습니다.


5) “새로운 메커니즘”의 신호: snRNA 유전자 변이의 존재감

신경/신경발달질환군에서 snRNA 유전자(RNU4-2, RNU2-2P, RNU5B-1) 병원성 변이가 눈에 띄게 관찰되었고, 진단된 신경/신경발달 환자 중 4.4%(15/339)에서 확인되었다고 보고했습니다. 이 부분은 앞으로 “희귀질환 진단에서 비코딩/비전형 유전자 영역”의 중요성이 더 커질 수 있음을 시사합니다.


6) 임상적 유용성: 진단이 실제 치료/관리 변화로 이어졌습니다

이 연구가 강력한 이유는 “진단율”에 더해 임상 행동 변화를 수치로 제시했기 때문입니다.

  • 진단된 환자 중 18.5%(124/672)에서 장기 치료 계획이 시행되었다고 보고했습니다.
  • 그중 유전진단이 치료 결정을 ‘명확히 촉발’한 경우4.0%(25/632)로 별도로 평가했으며, 예시로 SMA 치료 시작(14명), 미토콘드리아 질환 보충요법(3명) 등이 포함되었습니다.

7) “재분석(reanalysis)”의 중요성도 정량적으로 보여줍니다

연구진은 OMIM 기준으로 각 유전자-질환 연관성이 언제 알려졌는지 추적하여, 시간에 따른 누적 진단 잠재력을 시뮬레이션했습니다.

  • 2010년까지의 지식만으로는 발견 가능한 유전자가 약 60% 수준
  • 2020년 지식까지 확장하면 약 90% 수준
  • 또한 진단된 유전자 중 7.5%는 2021년 이후에 질환 연관성이 보고된 유전자였습니다.

즉, GS/ES 데이터는 “한 번 분석하고 끝”이 아니라 정기적 재분석이 진단율을 계속 끌어올릴 수 있는 구조임을 보여줍니다.


이 논문에서 얻을 수 있는 “의미” 정리

  1. GS는 희귀질환 진단에서 높은 진단율(46.2%)을 보였고, 특히 한국 코호트 기반 근거라는 점에서 의미가 큽니다.
  2. 기존 패널/엑솜에서 음성이었던 환자에서도 GS 진단율이 44.9%로 유지되어, “후속 검사로서의 가치”도 분명했습니다.
  3. 진단 기여의 핵심은 코딩 SNV만이 아니라 CNV, STR, 비코딩/딥인트론, 복잡 SV까지 포함한 “전 스펙트럼 변이 탐지”였습니다.
  4. 일부 케이스에서는 Nanopore long-read(nCATS) 같은 보조 기술이 “진단 확정”에 실질적으로 쓰였습니다.
  5. 무엇보다도, 진단이 실제 치료/관리 변화로 이어졌다는 점(18.5%)이 임상적 유용성을 강하게 뒷받침합니다.

한 줄 정리

단일기관 1,452개 한국 희귀질환 가족 코호트에서 전장유전체(GS)는 46.2% 진단율을 보였고, 진단의 14.6%는 GS에서만 가능한 변이 유형(비코딩/복잡 SV/반복확장 등)이 기여했으며, 18.5%에서는 치료·관리 변화로 이어져 “임상적 유용성”을 실제 데이터로 보여준 연구입니다.

https://www.nature.com/articles/s41525-025-00538-9