본문 바로가기
나노포어 논문/국내논문 정리

[서울대병원-문장섭 교수님] Cas9 기반 나노포어 타깃 시퀀싱으로 STR 반복 확장을 한 번에 진단하다

by youngmun 2026. 1. 23.

Cas9-enriched nanopore sequencing enables comprehensive and multiplexed detection of repeat expansions

Cas9 기반 나노포어 타깃 시퀀싱으로 STR 반복 확장을 한 번에 진단하다

 

– Nanopore Cas9-targeted sequencing(nCATS)와 STRiker를 이용한 차세대 반복확장 진단 전략

 

1. 연구 배경: STR 반복 확장 진단의 한계

Short Tandem Repeat(STR)는 2–7 bp 길이의 짧은 서열이 반복되는 구조로, 인간 유전체 전반에 100만 개 이상 존재합니다. 이 중 일부 STR은 반복 횟수가 비정상적으로 증가하면서 소뇌실조(spinocerebellar ataxia), NIID, 근육·신경계 질환 등을 유발합니다. 하지만 기존 STR 진단 방법에는 명확한 한계가 있습니다.

  • PCR 기반 fragment analysis
    • 반복 길이는 알 수 있지만,
    • 반복 서열의 정확한 구조(중단(interruption), motif 변화)는 알 수 없음
    • PCR 과정에서 DNA methylation 정보 소실
  • Short-read NGS (150–300 bp)
    • 반복 확장이 read 길이를 초과하면 정확한 repeat count 불가
    • 복잡한 반복 구조(혼합 motif) 분석 불가능
  • WES/WGS
    • 반복 영역 조립(assembly)이 매우 어려워 정확한 repeat 해석이 힘듦

즉, 반복 길이 + 반복 구조 + 메틸화 정보를 동시에 정확히 분석할 수 있는 방법이 필요했습니다.


2. 핵심 아이디어: nCATS + 나노포어 + STRiker

이 연구는 기존 nCATS(nanopore Cas9-targeted sequencing) 기술을 대폭 개선하고, 여기에 STR 전용 분석 알고리즘 STRiker를 결합했습니다.

핵심 목표는 단 하나다.
“한 번의 검사로, 현재 알려진 모든 STR 반복 확장 질환(56개 locus)을 동시에 정확하게 진단하자.”

3. 전체 워크플로우 개요

  1. 환자 혈액에서 고분자 gDNA 추출
  2. Cas9 + gRNA로 STR 주변 약 10 kb 영역 절단
  3. PCR 없이 바로 나노포어 라이브러리 제작
  4. MinION(R10.4.1)으로 시퀀싱
  5. Dorado basecalling → minimap2 정렬
  6. STRiker로 반복 구조·길이·메틸화 동시 분석
DNA 추출부터 결과 해석까지 약 25시간 
(기존 임상 진단: 수 주 ~ 수 개월)

4. 실험 방법 (Methods)

4.1 STR 타깃 설계 (56개 locus)

  • 2023년 기준 질병 연관 STR 56개 locus 선정
    • Panel A: 소뇌실조 관련
    • Panel B: 기타 STR 질환
  • 각 STR의 상·하류 약 5 kb 지점에 gRNA 설계
  • 결과적으로 약 10 kb fragment 생성
    → 나노포어의 길이 bias 최소화

4.2 Guide RNA(gRNA) 최적화 (in vitro cleavage assay)

  • 각 locus마다 3–5개 gRNA 후보 설계
  • Cas9 in vitro cleavage 효율 비교
  • 절단 효율 >90% gRNA 페어만 최종 선정
  • sgRNA vs crRNA:tracrRNA 비교
    • 효율 차이 없음
    • multiplex·비용 측면에서 crRNA:tracrRNA 채택
최종 조건
  • tracrRNA 6 pmol
  • crRNA 3 pmol / locus

4.3 nCATS 프로토콜 개선 포인트

기존 ONT Cas9 프로토콜 대비 핵심 개선 3가지:

  • Cas9 절단과 dA-tailing 분리
    • Cas9 제거 후 dA-tailing → 라이게이션 효율 증가
  • 어댑터 라이게이션 시간 연장
    • 10분 → 60분
  • Adaptive sampling 적용
    • 타깃 영역 아닌 read 실시간 배제
    • STR 영역 coverage 대폭 증가
결과:

  • 56개 locus 평균 균일한 coverage (~150–250×) 확보


4.4 시퀀싱 및 기본 분석

  • 플랫폼: MinION + R10.4.1
  • Basecalling: Dorado v0.6.2
  • Alignment: minimap2
  • BAM 처리: samtools

5. STRiker: STR 전용 분석 알고리즘

STRiker는 기존 도구와 달리 “모르는 motif도 찾아내는” 것이 핵심입니다.

5.1 STRiker의 특징

  • Reference motif + de novo motif 동시 탐지
  • motif 길이: 3–30 bp
  • 연속 반복 ≥3회 이상 → STR 후보
  • 회전 대칭(motif rotation) 자동 정규화
  • 반복 중간의 interruption 패턴 명확히 분해

예시:

(CAG)₃ (CAA)₁ (CAG)₂


5.2 STRiker 출력 결과

  • PDF 리포트
    • Read별 motif heatmap
    • Repeat length 분포(KDE)
    • 병적 threshold 시각화
  • Excel 파일
    • motif 종류별 반복 횟수
  • 메틸화 정보(5mC) 동시 제공

임상의가 “눈으로 바로 판단 가능한” 구조


6. 임상 적용 결과 (37명 소뇌실조 환자)

  • 기존 검사(WES/WGS/fragment analysis)로 원인 미확인 환자
  • nCATS + STRiker 적용 결과:
진단 성과
  • 12명 진단 성공 (32.4%)
    • FGF14: 4명
    • ATXN8OS: 2명
    • RFC1: 2명
    • NOP56: 2명
    • NOTCH2NLC: 1명
    • PRNP: 1명
평균 진단 지연 시간: 8.9년
→ 단일 검사로 진단 종료

7. 새롭게 밝혀진 생물학적 인사이트

7.1 FGF14 반복 구조의 다양성

  • 기존: GAA, GAAGGA
  • 신규 발견:
    • AAAAAC
    • GCAGAAGCA(GAA)₂
  • 특정 motif는 조기 발병·비전형적 증상과 연관

7.2 메틸화와 세대 간 반복 변화 (NOTCH2NLC)

  • 나노포어의 장점: native DNA 메틸화 보존
  • 흥미로운 관찰:
    • 모계 유전 시 반복 수 증가 + hypermethylation
    • 반복은 크지만 증상은 억제된 사례 존재

반복 길이 + 메틸화 상태를 동시에 봐야 질병 예측 가능


8. 이 연구의 의미

  • PCR 없이 STR 진단 가능
  • 반복 길이·구조·메틸화 동시 분석
  • 모든 STR 질환을 단일 패널로 진단
  • 임상 적용 가능한 속도(1–2일)

이 연구는 STR 반복 확장 질환 진단에서 “WES 이전과 이후”처럼 기준이 바뀌는 전환점이 될 가능성이 큽니다.

https://www.biorxiv.org/content/10.1101/2025.11.24.690106v1.full