본문 바로가기
나노포어 분석/분석 도구

[분석/DRS] SingleMod — Nanopore Direct RNA 시퀀싱 기반 단일 분자 m6A 변형 검출 도구

by youngmun 2025. 12. 5.

SingleMod 소개 — 나노포어 DRS로 단일 RNA 분자의 m6A 수정(Methylation) 검출

 

SingleMod이 뭔가요?

  • SingleMod은 딥러닝 기반의 분석 도구로, Oxford Nanopore Technologies (ONT)의 직접 RNA 시퀀싱 (Direct RNA Sequencing, DRS) 데이터를 이용하여, 단일 RNA 분자(single-molecule) 수준에서 m6A 메틸화 (adenosine 6-methyladenosine) 위치를 정밀히 예측할 수 있게 설계된 툴입니다.
  • 논문은 2025년 6월 2일자 Nature Communications 에 게재되어 있으며, 이는 SingleMod의 과학적 타당성 및 성능을 뒷받침합니다.
  • 또한 SingleMod은 m6A 뿐 아니라 “다른 핵산 변형 (other nucleic acid modifications)” 에 대해서도 학습 가능한 범용 프레임워크로 설계되었다고 명시되어 있습니다.


SingleMod의 작동 방식 및 요구 조건

✔ 지원 데이터

  • ONT DRS 데이터: RNA002 키트 또는 최신 RNA004 키트를 사용한 데이터 지원.
  • 원시신호 파일: fast5 또는 pod5 형식 — 여기에는 전류(signal) 정보(raw current signal)가 포함되어야 합니다.
  • 참고서열(reference): genome.fa 또는 transcript.fa (저자는 genome reference 사용 권장)
  • (모델 직접 학습 시) 메틸화 비율 레이블 파일: methylation_rate.bed. 단순 예측용이라면 레이블은 필수 아님.

✔ 분석 환경

  • 운영체제: Linux
  • Python 3.6 이상 필요
  • 외부 도구: base-calling (Guppy 또는 Dorado), read mapping (minimap2), BAM/FASTQ/신호 처리 (samtools, bedtools, Picard, nanopolish or f5c), 그리고 딥러닝 프레임워크 (PyTorch) 등이 필요합니다.

✔ 제공 스크립트 및 기능

SingleMod 저장소에는 아래 주요 스크립트가 포함되어 있습니다.

스크립트 기능
SingleMod_m6A_prediction.py 단일 분자 수준에서 m6A 예측 수행
bam_mark_m6A.py 예측된 m6A 위치를 BAM 파일에 표시 → IGV 등 시각화 가능
organize_from_eventalign.py / merge_motif_npy.py nanopolish (또는 f5c) eventalign 결과에서 원시 신호 + motif 정보 정리
SingleMod_train.py (원한다면) 사용자 자체 모델을 학습할 수 있는 스크립트

즉, 제공된 pipeline을 따라 진행하면 raw signal → alignment → feature extraction → 예측 → 시각화까지 엔드-투-엔드 (end-to-end) 로 m6A 프로파일을 얻을 수 있습니다.


SingleMod의 주요 장점 및 의의

  • Single-molecule resolution: 기존 bulk 메틸화 방법과 달리, 개별 RNA 분자 수준에서 m6A 여부를 예측할 수 있어 heterogeneity (이종성) 분석 가능.
  • ONT DRS 활용: 별도의 bisulfite 처리나 RT-based 변환 없이, 직접 RNA 시퀀싱 데이터에서 변형을 탐지 가능 — 실험 간소화.
  • 유연성 / 확장성: m6A 외 다른 RNA 변형 또는 잠재적으로 DNA 변형 탐지 모델로도 확장 가능.
  • 오픈소스 & 투명성: pip/conda 패키지로 배포된 바이너리형이 아니라, 스크립트 + 모델 + raw data 처리 과정을 모두 열람 가능 → 연구자가 직접 수정, 확장, 디버깅 가능한 구조.

유의사항 / 현재 제한점

  • 설치나 패키지화가 제공되지 않음: Conda 환경이나 pip 설치 명령이 따로 제공되지 않아, 사용자가 직접 환경을 세팅해야 함. 실제로 GitHub issue에서도 “설치 관련 명확한 커맨드가 없음”이라는 지적이 있습니다.
  • 병렬 처리 중 일부 오류 보고됨: 예를 들어 merge_motif_npy.py 스크립트 사용 시 multiprocessing 관련 오류가 일부 사용자에게 보고된 바 있습니다.
  • 충분한 coverage 필요: training 데이터로 사용된 fast5 파일이 replicate 하나만 있을 경우, coverage ≥ 20인 사이트 수가 매우 제한적이라는 사용자의 피드백이 있습니다.
  • Linux + command-line 환경 필요 / GUI 없음: 커맨드라인에 익숙한 사용자만 사용하기 적합합니다.

SingleMod은 Nanopore 직접 RNA 시퀀싱 데이터를 딥러닝으로 분석해, 단일 RNA 분자 수준에서 m6A 메틸화를 검출할 수 있게 해주는 오픈소스 툴입니다.

https://github.com/xieyy46/SingleMod-v1

단일 분자 Direct RNA 시퀀싱으로 규명한 종 간 Epitranscriptome 조절 구조

(Single-molecule direct RNA sequencing reveals the shaping of epitranscriptome across multiple species)

 

1. 연구 배경

RNA 변형(m6A 등)은 유전자 발현을 조절하는 중요한 층(epitranscriptome)을 형성합니다.
그러나 대부분의 기존 연구는 short-read 또는 RT 기반 접근을 사용하여,

  • RNA 변형의 단일 분자 수준 이질성,
  • 종 간 변형의 보존성,
  • RNA 운명(turnover)에 미치는 기능적 영향 을 충분히 해석하기 어려웠습니다.

Nanopore Direct RNA Sequencing(DRS)은 RNA 원본 분자 그대로를 읽는 기술로, RNA 변형을 직접(raw signal 기반) 관찰할 수 있는 큰 장점을 제공합니다.


2. 연구 목적

이 논문은 Nanopore DRS와 자체 개발한 SingleMod 모델을 이용해 인간·마우스·초파리·식물 등 여러 생물 종에 걸쳐 RNA 변형이 어떻게 조절되는지 단일 RNA 분자(single-molecule) 수준에서 규명하는 것을 목표로 합니다.


3. 분석 방법 – SingleMod 모델 기반 단일 분자(m6A) 예측

SingleMod는 Nanopolish eventalign 기반 신호 특징(feature)과 딥러닝 모델을 결합해 각 RNA 분자가 m6A 변형을 갖는지 여부(1/0) 를 직접 판정합니다.

이를 통해 다음과 같은 분석이 가능합니다:

  • 단일 RNA 분자 단위의 변형 이질성(heterogeneity) 탐지
  • 리드별 변형 패턴을 기반으로 한 site-level 변형 비율 계산
  • 종 간 / 조직 간 epitranscriptome의 구성 비교
  • 변형이 발현량, RNA 안정성과 어떤 관계를 갖는지 분석
즉, 변형이 "얼마나 있는가?"가 아니라
“어떤 분자가 변형을 가지고 있는가?” 를 직접 연구할 수 있다는 점이 기존 기법과 큰 차이입니다.

4. 주요 결과

  1. 단일 분자 수준 RNA 변형 이질성 발견
    같은 유전자라도 RNA 분자마다 변형 여부가 다르며,
    epitranscriptome은 다양한 변형 상태의 RNA population으로 구성되어 있음을 확인했습니다.

  2. 여러 종에 걸쳐 보존된 m6A hotspot 확인
    인간·마우스·식물 등에서 비슷한 위치에 변형이 나타나며,
    이는 epitranscriptome의 진화적 보존성을 의미합니다.

  3. 변형 패턴은 RNA 발현·안정성과 깊은 연관
    변형이 많은 RNA는 turnover, degradation,
    발현량 조절과 밀접하게 연결되어 있음을 제시합니다.

  4. Direct RNA 기반 분석의 강점 입증
    RT-free 특성을 통해 기존 기술에서 보이지 않던
    원본 RNA 수준의 epitranscriptome 정보를 확보할 수 있었습니다.

5. 연구 의의

  • epitranscriptome 연구에 새로운 분석 축 추가
  • single-molecule 기반 변형 연구의 가능성을 최초로 제시
  • Nanopore DRS 기술의 장점을 직접적으로 활용한 대표 사례
  • 다양한 종에서 RNA 변형의 기능적·진화적 특징을 비교한 최초 규모 연구

생각해보기: Dorado의 RNA modification 기능과의 관계


Nanopore의 공식 basecaller인 Dorado 역시 최신 모델(v5.x 이상)을 통해 다양한 RNA modification(m6A, m5C, pseudouridine, inosine 등) 을 지원합니다. 즉, Dorado에서도 RNA 변형을 탐지할 수 있습니다.

그러나 두 도구는 설계 목적이 다르기 때문에 직접 비교 대상이라기보다는 ‘상호 보완적’입니다.


Dorado RNA modification 모델 — 강점

  • basecalling과 동시에 변형 확률(mod probability)을 제공
  • 빠르고 안정적이며 대규모 샘플 분석에 적합
  • site-level 변형 fraction을 쉽게 계산할 수 있음
  • DNA + RNA 변형을 모두 다룰 수 있는 통합 기반

SingleMod 접근 — 강점

  • Direct RNA 전용 분석 모델
  • eventalign 기반 딥러닝으로 단일 RNA 분자의 변형 여부 직접 판정
  • 분자 간 변형 이질성(heterogeneity) 연구에 최적화
  • epitranscriptome 연구(진화, 조직 특성, 기능 분석)에 매우 적합

어떤 경우에 어떤 도구를 선택해야 할까?

연구 목적 더 적합한 도구 이유
RNA 변형을 “한 분자 단위”로 보고 싶다 SingleMod 리드별 변형 여부 판단 가능
epitranscriptome의 종 간 비교 / 진화 연구 SingleMod motif-level, molecule-level 분석
대규모 RNA/DNA 변형 site-level 프로파일링 Dorado + Modkit 빠르고 안정적, 처리량 우수
DNA 메틸화(5mC/5hmC) 연구 Dorado 공식 지원, 정확도 높음
RNA 변형 존재 여부 및 site-level fraction이 필요 Dorado 간단하고 효율적
epitranscriptome의 기능적 이질성을 정밀 분석 SingleMod heterogeneity 분석 가능

최종 요약

 

이 논문은 Nanopore Direct RNA Sequencing과 SingleMod 모델을 활용하여 단일 분자 수준에서 RNA 변형을 직접 검출하고, 여러 생물 종에 걸친 epitranscriptome의 조절 구조를 밝힌 연구입니다. Dorado도 다양한 RNA modification을 지원하지만, site-level 변형 프로파일링에 최적화되어 있으며, 단일 분자 수준의 변형 이질성 분석은 SingleMod처럼 전용(single-molecule resolved) 접근이 필요한 분야입니다. 두 방법은 연구 목적에 따라 상호 보완적으로 활용할 수 있습니다.

 

 

https://www.nature.com/articles/s41467-025-60447-4?utm_source=chatgpt.com