본문 바로가기
나노포어 최신 동향/연구 · 응용 사례

[동영상] Oxford Nanopore 기반 FSHD에서의 D4Z4 반복 배열 구조 및 후성유전체 프로파일링

by youngmun 2026. 1. 15.

D4Z4 반복 길이, 4q 하플로타입, 메틸화, 변이를 Single Assay로 확인할 수 있을까?

 

3줄 요약

  • FSHD 진단의 핵심 요소인 D4Z4 반복 수(수축 여부), 4qA 하플로타입, 메틸화 상태는 기존에는 여러 검사를 조합하여 확인해야 했습니다.
  • Oxford Nanopore의 long-read sequencing과 native DNA 메틸화 신호를 이용하면 이러한 정보를 한 번의 시퀀싱 데이터에서 동시에 확보할 수 있습니다.
  • Ultra-long(ULK)은 가장 직관적인 whole-array spanning read를 제공하지만, 실제 분석에서는 표준 Ligation(LSK, ~30 kb) + assembly 전략으로도 대부분 높은 일치도를 보였습니다.

https://www.youtube.com/watch?v=yZ7KEaBDI3Y


1. FSHD에서 D4Z4가 왜 까다로운가?

FSHD(안면견갑상완 근이영양증)는 DUX4 발현과 직접적으로 연결된 유전 질환입니다.
문제는 DUX4가 위치한 영역의 구조적 특수성에 있습니다.

  • 염색체 4번 말단(telomere)에 위치
  • D4Z4라는 고도로 반복적인 배열 내부/인접 영역에 존재
  • 각 반복 유닛은 약 3.3 kb
  • 전체 배열 길이는 수십 kb에서 수백 kb까지 다양

FSHD1

  • 정상인: D4Z4 반복이 약 10–100개 (유닛당 약 3.3 kb → 총 길이 최대 수백 kb)
  • FSHD1: 반복 수가 10개 이하로 수축(contraction)

FSHD2

  • 반복 길이는 정상 범위
  • SMCHD1 등 후성유전체 조절 유전자 변이
  • D4Z4 영역 전반의 저메틸화(hypomethylation) 발생

따라서 반복 길이와 메틸화 상태를 동시에 평가하는 것이 핵심입니다.

 


2. 왜 4qA 하플로타입이 중요한가?

 

D4Z4 유사 영역은 염색체 10번에도 존재하며, 염기서열 유사도가 98–100%에 달합니다.
따라서 다음을 정확히 구분해야 합니다.

  • 4번 염색체인지 10번 염색체인지
  • 4qA인지 4qB인지

임상적으로 의미 있는 것은 4qA allele입니다.
4qB나 10q는 polyA 신호 특성상 안정적인 DUX4 전사체 형성이 어렵기 때문에 병인성과 직접적으로 연결되지 않습니다.

즉, 단순히 반복 수만 세는 것으로는 충분하지 않습니다.
반드시 4qA 하플로타이핑이 병행되어야 합니다.


3. 기존 FSHD 진단의 한계

 

기존 진단에서는 다음 요소들을 각각 다른 검사로 확인해야 했습니다.

  • D4Z4 반복 길이 측정 (Southern blot 등)
  • 구조적 분석 (OGM 등)
  • FSHD2 관련 유전자 변이 분석 (short-read WGS 등)
  • 메틸화 분석 (별도 epigenetic assay)

즉, 하나의 통합된 데이터로 해석하기 어려웠습니다.


4. Nanopore 접근의 핵심 장점

 

Oxford Nanopore 플랫폼은 다음 세 가지 특징을 동시에 제공합니다.

  • Long-read: 반복 배열 전체 또는 큰 구간을 단일 read로 관통 가능
  • PCR-free (native DNA): DNA 메틸화 신호를 손실 없이 유지
  • Basecalling 단계에서 메틸화 동시 해석: 별도 실험 없이 CpG methylation 정보 획득 가능

그 결과, 단일 시퀀싱 데이터에서 다음을 동시에 분석할 수 있습니다.

  • 4q haplotype
  • D4Z4 repeat length
  • 구조적/염기 변이
  • 메틸화 패턴

5. 실험 전략: Ultra-long vs 표준 Ligation

 

(1) Ultra-long (ULK)

  • 평균 100 kb 이상
  • 경우에 따라 500 kb 이상 read 확보 가능
  • D4Z4 전체 배열을 단일 read로 관통 가능

→ 반복 수를 직접 카운트하는 “ground truth”에 가까운 접근

 

(2) 표준 Ligation (LSK)

  • 평균 read length 약 30 kb
  • 일반적인 WGS 워크플로우

전체 배열을 한 번에 넘기지 못할 수 있으므로:

  1. Assembly 수행
  2. 생성된 contig에서 반복 수 계산

6. 반복 수 분석 결과

  • ULK 기반 반복 수와
  • LSK + assembly 기반 반복 수가

대부분의 샘플에서 매우 높은 일치도를 보였습니다.

 

차이가 발생한 경우에도 대부분 ±1–2 repeat 수준이었으며, 이는 반복 서열 assembly collapse 가능성으로 설명되었습니다.

 

또한 일부 샘플에서는 566 kb 단일 read가 확보되어, 150 repeats 수준의 매우 긴 배열도 직접 관측되었습니다.

 

결론적으로, ULK가 가장 직관적이지만 임상/현실적 접근에서는 LSK 기반 전략도 충분히 유효함을 보여주었습니다.


7. 메틸화 분석 결과

FSHD1의 병리 모델은 다음과 같습니다.

  • 반복 수축 발생
  • 해당 allele에서 저메틸화 발생
  • DUX4 발현 증가

Nanopore 데이터에서도 동일한 패턴이 관찰되었습니다.

  • 정상 길이 allele → 상대적으로 높은 메틸화
  • 수축 allele → 뚜렷한 저메틸화

즉, 반복 길이와 메틸화 상태가 동일 데이터 내에서 일관되게 확인되었습니다.


8. 반복 길이와 무관한 저메틸화 사례

 

ICF syndrome과 같은 사례에서는:

  • 반복 길이는 정상
  • 모든 allele에서 저메틸화 발생
  • DNMT3B 변이의 haplotype phasing 가능

이는 FSHD2 맥락에서:

  • 반복 길이만으로는 충분하지 않으며
  • 메틸화와 변이 정보를 함께 봐야 한다는 점을 보여줍니다.

9. 확장 가능성: 크로마틴 접근성

6mA 기반 오픈 크로마틴 assay를 적용하면,

  • 수축된 allele에서 접근성 증가
  • DUX4 발현 증가 모델과 일관된 방향성

까지 추가적으로 확인할 수 있습니다.


결론: “FSHD 핵심 정보를 단일 플랫폼에서 묶는” 방향

  • Nanopore long-read sequencing은 FSHD 진단에서 가장 어려운 영역인 D4Z4 반복 배열을 대상으로,
    1. 4qA 하플로타이핑
    2. 반복 길이 측정
    3. 메틸화 분석
    4. 변이 분석
    5. (확장 시) 크로마틴 접근성 평가를 단일 플랫폼에서 통합적으로 수행할 수 있는 가능성을 제시합니다.
Ultra-long은 가장 직관적인 해석을 가능하게 하지만,
실제 적용 관점에서는 표준 LSK + assembly 전략으로도 상당히 높은 정확도를 확보할 수 있습니다.