본문 바로가기
나노포어 논문/RNA

[Isoform] Long-read 기반 isoform 발현 차이 및 조절 메커니즘 분석

by youngmun 2025. 5. 13.

배경: 왜 isoform 단위의 eQTL 분석인가?

유전자 발현량의 차이를 유전적으로 설명하기 위한 eQTL 분석은 크게 네 가지 단계로 진행됩니다. 먼저, 연구자는 여러 명의 사람(보통 수십~수백 명)으로부터 DNA와 RNA 샘플을 동시에 수집합니다. 이렇게 해야 각 개인이 가지고 있는 유전적 변이(SNP 등)해당 유전자의 발현량(mRNA)을 함께 비교할 수 있기 때문입니다.

 

그다음은 DNA 분석 단계입니다. 여기서는 WGS(전장 유전체 시퀀싱) 또는 SNP array를 통해 각 사람마다 어떤 유전적 변이를 가지고 있는지 확인합니다.

 

즉, "누구는 A를 가지고 있고, 누구는 G를 가지고 있다"와 같은 유전자형 정보(genotype)를 얻는 과정이에요.

동시에 RNA 시퀀싱(RNA-seq)을 통해 유전자별 발현량(=mRNA 양)을 측정합니다. 이 결과는 A 유전자는 얼마나 발현되고, B 유전자는 얼마나 발현됐는지를 수치로 보여줍니다.마지막으로, 이 두 데이터를 통계적으로 연결하는 분석 단계가 진행됩니다.

 

예를 들어, 특정 SNP에서 'G'를 가진 사람은 A 유전자가 많이 발현되고, 'A'를 가진 사람은 적게 발현된다면, 이 SNP는 A 유전자의 발현에 영향을 주는 eQTL로 간주됩니다. 이러한 분석은 일반적으로 선형 회귀(linear regression) 같은 모델을 사용해 수행됩니다. 이 과정을 통해 우리는 DNA 상의 어떤 위치가 유전자 발현에 영향을 주는지를 정확히 파악할 수 있고,
이를 통해 질병, 약물 반응, 개인 맞춤의학의 중요한 단서를 발견할 수 있습니다.


기존의 eQTL (expression quantitative trait loci)연구는 주로 유전자 수준의 발현량을 분석해왔지만, 하나의 유전자가 다양한 아이소폼(isoform)을 만들어낼 수 있다는 점에서 단일 유전자 발현 분석은 한계가 있습니다. 따라서 실제 질병 기전이나 유전적 조절을 정확히 이해하려면 isoform eQTL 분석(ieQTL)이 필요합니다. 이 연구는 이를 위해 롱리드 시퀀싱(long-read sequencing)을 활용했습니다.

A. 유전자와 isoform: 하나의 유전자는 여러 isoform을 만들 수 있으며, 회색 박사는 엑손, 실선은 인트론, 점선은 스플라이싱 경로를 나타냄. B. gene eQTL과 ieQTL 발현 패턴: gene eQTL은 유전체 전체 발현에 영향을 주는 반면, ieQTL은 특정 isoform의 발현에만 영향을 줄 수 있음. 일부 ieQTL은 전체 발현에는 영향을 주지 않아 gene eQTL 분석으로는 놓칠 수 있음. C. Differential ieQTL 및 Opposite ieQTL: differential ieQTL은 isoform마다 효고가 다르게 나타나고, opposite ieQTL은 isoform 간에 반대 방향의 효과를 보임. D. gene eQTL과 ieQTL 탐지 수 비교: 본 연구에서 gene eQTL과 ieQTL은 일부만 겹치며, ieQTL은 새로운 조절 정보를 제공함.

 


실험 방법: 어떻게 분석했는가?

샘플 및 전처리

  • 대상 샘플: 일본인 67명의 건강한 B 세포
  • RNA 추출 및 시퀀싱:
    • 롱리드 시퀀싱: Oxford Nanopore Technologies 플랫폼 이용
    • Short-read 시퀀싱도 병행하여 비교 분석

유전체 분석

  • isoform 정량화:
    • FLAMES 툴을 사용해 isoform 정의 및 정량 수행
  • ieQTL 탐지:
    • QTLtools를 사용해 isoform 발현량과 유전체 변이(SNP) 간의 상관성 분석
  • 기존 short-read 기반 eQTL과 비교

기능 검증 실험

  • CRISPR–Cas9 유전체 편집:
    • 특정 ieQTL 좌위의 SNP를 제거하거나 변경하여 isoform 발현 변화 확인
  • 미니진 스플라이싱 실험:
    • 인공적으로 구성한 미니 유전자에 SNP 삽입 → 스플라이싱 결과 비교

후속 분석

  • 히스톤 마크 ChIP-seq 데이터와 겹침 분석:
    • H3K36me3, H3K4me1, H3K4me3 등과의 연관성 확인
  • GWAS 데이터와 비교:
    • ieQTL이 질병 관련 변이와 얼마나 연관되는지 평가

주요 결과 요약

항목 내용
총 탐지된 ieQTL 수 17,119개
기존 eQTL과 중복되지 않는 비율 70.6%
유전자 내 상반된 isoform 조절 다수 존재
CRISPR 실험 결과 원거리 SNP가 특정 isoform 발현 조절 가능함 입증
미니진 실험 결과 기존 예측 툴이 놓친 기능성 변이 다수 발견
GWAS 연관성 ieQTL이 기존 eQTL보다 높은 연관성 가짐

연구의 의의

  • 롱리드 시퀀싱은 isoform 수준의 정밀한 발현 조절 메커니즘을 밝혀내는 데 필수적인 도구임을 입증
  • 기존 short-read 기반 분석으로는 놓치기 쉬운 복잡한 스플라이싱 패턴, 기능적 SNP, 질병 연관 메커니즘을 포착 가능
  • 향후 정밀의료, 질병 유전체학, 표적 치료 연구에 적용 가능성 높음