SingleMod 소개 — 나노포어 DRS로 단일 RNA 분자의 m6A 수정(Methylation) 검출
SingleMod이 뭔가요?
- SingleMod은 딥러닝 기반의 분석 도구로, Oxford Nanopore Technologies (ONT)의 직접 RNA 시퀀싱 (Direct RNA Sequencing, DRS) 데이터를 이용하여, 단일 RNA 분자(single-molecule) 수준에서 m6A 메틸화 (adenosine 6-methyladenosine) 위치를 정밀히 예측할 수 있게 설계된 툴입니다.
- 논문은 2025년 6월 2일자 Nature Communications 에 게재되어 있으며, 이는 SingleMod의 과학적 타당성 및 성능을 뒷받침합니다.
- 또한 SingleMod은 m6A 뿐 아니라 “다른 핵산 변형 (other nucleic acid modifications)” 에 대해서도 학습 가능한 범용 프레임워크로 설계되었다고 명시되어 있습니다.

SingleMod의 작동 방식 및 요구 조건
✔ 지원 데이터
- ONT DRS 데이터: RNA002 키트 또는 최신 RNA004 키트를 사용한 데이터 지원.
- 원시신호 파일: fast5 또는 pod5 형식 — 여기에는 전류(signal) 정보(raw current signal)가 포함되어야 합니다.
- 참고서열(reference): genome.fa 또는 transcript.fa (저자는 genome reference 사용 권장)
- (모델 직접 학습 시) 메틸화 비율 레이블 파일: methylation_rate.bed. 단순 예측용이라면 레이블은 필수 아님.
✔ 분석 환경
- 운영체제: Linux
- Python 3.6 이상 필요
- 외부 도구: base-calling (Guppy 또는 Dorado), read mapping (minimap2), BAM/FASTQ/신호 처리 (samtools, bedtools, Picard, nanopolish or f5c), 그리고 딥러닝 프레임워크 (PyTorch) 등이 필요합니다.
✔ 제공 스크립트 및 기능
SingleMod 저장소에는 아래 주요 스크립트가 포함되어 있습니다.
| 스크립트 | 기능 |
| SingleMod_m6A_prediction.py | 단일 분자 수준에서 m6A 예측 수행 |
| bam_mark_m6A.py | 예측된 m6A 위치를 BAM 파일에 표시 → IGV 등 시각화 가능 |
| organize_from_eventalign.py / merge_motif_npy.py | nanopolish (또는 f5c) eventalign 결과에서 원시 신호 + motif 정보 정리 |
| SingleMod_train.py | (원한다면) 사용자 자체 모델을 학습할 수 있는 스크립트 |
즉, 제공된 pipeline을 따라 진행하면 raw signal → alignment → feature extraction → 예측 → 시각화까지 엔드-투-엔드 (end-to-end) 로 m6A 프로파일을 얻을 수 있습니다.
SingleMod의 주요 장점 및 의의
- Single-molecule resolution: 기존 bulk 메틸화 방법과 달리, 개별 RNA 분자 수준에서 m6A 여부를 예측할 수 있어 heterogeneity (이종성) 분석 가능.
- ONT DRS 활용: 별도의 bisulfite 처리나 RT-based 변환 없이, 직접 RNA 시퀀싱 데이터에서 변형을 탐지 가능 — 실험 간소화.
- 유연성 / 확장성: m6A 외 다른 RNA 변형 또는 잠재적으로 DNA 변형 탐지 모델로도 확장 가능.
- 오픈소스 & 투명성: pip/conda 패키지로 배포된 바이너리형이 아니라, 스크립트 + 모델 + raw data 처리 과정을 모두 열람 가능 → 연구자가 직접 수정, 확장, 디버깅 가능한 구조.
유의사항 / 현재 제한점
- 설치나 패키지화가 제공되지 않음: Conda 환경이나 pip 설치 명령이 따로 제공되지 않아, 사용자가 직접 환경을 세팅해야 함. 실제로 GitHub issue에서도 “설치 관련 명확한 커맨드가 없음”이라는 지적이 있습니다.
- 병렬 처리 중 일부 오류 보고됨: 예를 들어 merge_motif_npy.py 스크립트 사용 시 multiprocessing 관련 오류가 일부 사용자에게 보고된 바 있습니다.
- 충분한 coverage 필요: training 데이터로 사용된 fast5 파일이 replicate 하나만 있을 경우, coverage ≥ 20인 사이트 수가 매우 제한적이라는 사용자의 피드백이 있습니다.
- Linux + command-line 환경 필요 / GUI 없음: 커맨드라인에 익숙한 사용자만 사용하기 적합합니다.
SingleMod은 Nanopore 직접 RNA 시퀀싱 데이터를 딥러닝으로 분석해, 단일 RNA 분자 수준에서 m6A 메틸화를 검출할 수 있게 해주는 오픈소스 툴입니다.
https://github.com/xieyy46/SingleMod-v1
단일 분자 Direct RNA 시퀀싱으로 규명한 종 간 Epitranscriptome 조절 구조
(Single-molecule direct RNA sequencing reveals the shaping of epitranscriptome across multiple species)
1. 연구 배경
RNA 변형(m6A 등)은 유전자 발현을 조절하는 중요한 층(epitranscriptome)을 형성합니다.
그러나 대부분의 기존 연구는 short-read 또는 RT 기반 접근을 사용하여,
- RNA 변형의 단일 분자 수준 이질성,
- 종 간 변형의 보존성,
- RNA 운명(turnover)에 미치는 기능적 영향 을 충분히 해석하기 어려웠습니다.
Nanopore Direct RNA Sequencing(DRS)은 RNA 원본 분자 그대로를 읽는 기술로, RNA 변형을 직접(raw signal 기반) 관찰할 수 있는 큰 장점을 제공합니다.
2. 연구 목적
이 논문은 Nanopore DRS와 자체 개발한 SingleMod 모델을 이용해 인간·마우스·초파리·식물 등 여러 생물 종에 걸쳐 RNA 변형이 어떻게 조절되는지 단일 RNA 분자(single-molecule) 수준에서 규명하는 것을 목표로 합니다.
3. 분석 방법 – SingleMod 모델 기반 단일 분자(m6A) 예측
SingleMod는 Nanopolish eventalign 기반 신호 특징(feature)과 딥러닝 모델을 결합해 각 RNA 분자가 m6A 변형을 갖는지 여부(1/0) 를 직접 판정합니다.
이를 통해 다음과 같은 분석이 가능합니다:
- 단일 RNA 분자 단위의 변형 이질성(heterogeneity) 탐지
- 리드별 변형 패턴을 기반으로 한 site-level 변형 비율 계산
- 종 간 / 조직 간 epitranscriptome의 구성 비교
- 변형이 발현량, RNA 안정성과 어떤 관계를 갖는지 분석
즉, 변형이 "얼마나 있는가?"가 아니라
“어떤 분자가 변형을 가지고 있는가?” 를 직접 연구할 수 있다는 점이 기존 기법과 큰 차이입니다.
4. 주요 결과
- 단일 분자 수준 RNA 변형 이질성 발견
같은 유전자라도 RNA 분자마다 변형 여부가 다르며,
epitranscriptome은 다양한 변형 상태의 RNA population으로 구성되어 있음을 확인했습니다. - 여러 종에 걸쳐 보존된 m6A hotspot 확인
인간·마우스·식물 등에서 비슷한 위치에 변형이 나타나며,
이는 epitranscriptome의 진화적 보존성을 의미합니다. - 변형 패턴은 RNA 발현·안정성과 깊은 연관
변형이 많은 RNA는 turnover, degradation,
발현량 조절과 밀접하게 연결되어 있음을 제시합니다. - Direct RNA 기반 분석의 강점 입증
RT-free 특성을 통해 기존 기술에서 보이지 않던
원본 RNA 수준의 epitranscriptome 정보를 확보할 수 있었습니다.
5. 연구 의의
- epitranscriptome 연구에 새로운 분석 축 추가
- single-molecule 기반 변형 연구의 가능성을 최초로 제시
- Nanopore DRS 기술의 장점을 직접적으로 활용한 대표 사례
- 다양한 종에서 RNA 변형의 기능적·진화적 특징을 비교한 최초 규모 연구
생각해보기: Dorado의 RNA modification 기능과의 관계
Nanopore의 공식 basecaller인 Dorado 역시 최신 모델(v5.x 이상)을 통해 다양한 RNA modification(m6A, m5C, pseudouridine, inosine 등) 을 지원합니다. 즉, Dorado에서도 RNA 변형을 탐지할 수 있습니다.
그러나 두 도구는 설계 목적이 다르기 때문에 직접 비교 대상이라기보다는 ‘상호 보완적’입니다.
Dorado RNA modification 모델 — 강점
- basecalling과 동시에 변형 확률(mod probability)을 제공
- 빠르고 안정적이며 대규모 샘플 분석에 적합
- site-level 변형 fraction을 쉽게 계산할 수 있음
- DNA + RNA 변형을 모두 다룰 수 있는 통합 기반
SingleMod 접근 — 강점
- Direct RNA 전용 분석 모델
- eventalign 기반 딥러닝으로 단일 RNA 분자의 변형 여부 직접 판정
- 분자 간 변형 이질성(heterogeneity) 연구에 최적화
- epitranscriptome 연구(진화, 조직 특성, 기능 분석)에 매우 적합
어떤 경우에 어떤 도구를 선택해야 할까?
| 연구 목적 | 더 적합한 도구 | 이유 |
| RNA 변형을 “한 분자 단위”로 보고 싶다 | SingleMod | 리드별 변형 여부 판단 가능 |
| epitranscriptome의 종 간 비교 / 진화 연구 | SingleMod | motif-level, molecule-level 분석 |
| 대규모 RNA/DNA 변형 site-level 프로파일링 | Dorado + Modkit | 빠르고 안정적, 처리량 우수 |
| DNA 메틸화(5mC/5hmC) 연구 | Dorado | 공식 지원, 정확도 높음 |
| RNA 변형 존재 여부 및 site-level fraction이 필요 | Dorado | 간단하고 효율적 |
| epitranscriptome의 기능적 이질성을 정밀 분석 | SingleMod | heterogeneity 분석 가능 |
최종 요약
이 논문은 Nanopore Direct RNA Sequencing과 SingleMod 모델을 활용하여 단일 분자 수준에서 RNA 변형을 직접 검출하고, 여러 생물 종에 걸친 epitranscriptome의 조절 구조를 밝힌 연구입니다. Dorado도 다양한 RNA modification을 지원하지만, site-level 변형 프로파일링에 최적화되어 있으며, 단일 분자 수준의 변형 이질성 분석은 SingleMod처럼 전용(single-molecule resolved) 접근이 필요한 분야입니다. 두 방법은 연구 목적에 따라 상호 보완적으로 활용할 수 있습니다.
https://www.nature.com/articles/s41467-025-60447-4?utm_source=chatgpt.com