본문 바로가기
나노포어 분석/분석 도구

[분석] Egzotek — Long-read 기반 비모델 생물 전사체(annotation) 구축 워크플로우

by youngmun 2025. 12. 4.

Egzotek — Long-read 기반 비모델 생물 전사체(annotation) 구축 워크플로우

 

Egzotek은 genome annotation이 부실하거나 없는 비모델 생물에서도,

long-read RNA 시퀀싱 데이터만으로 고품질 전사체와 주석(annotation)을 자동 생성할 수 있는 bioinformatics 파이프라인입니다.

 

Nextflow 기반이며 GPL-3.0으로 오픈소스화되어 있어, 누구나 자유롭게 사용할 수 있습니다.

 

이 워크플로우를 사용하면, 유전체 reference가 불완전하더라도 isoform 구조, 새로운 유전자, alternative splicing, 전사체 다양성 등을 탐색할 수 있어 생물다양성 연구, 비모델 생물 연구, 생태유전학 등에 매우 유용합니다.

 

추천 되는 경우:

 

  • 연구 대상이 비모델 생물종이거나, 기존 annotation이 없거나 부실한 생물
  • 유전체 염기가 완전히 정리되지 않았지만, 전사체 정보가 필요할 때
  • Isoform, alternative splicing, 유전자 발현 조사, 유전자 구조 예측을 하고 싶을 때
  • 실험실에서 자체적으로 데이터 생성 → 전사체 구축 → 공개/논문화까지 이어가고 싶을 때

 

사용법:

GitHub에서 클론한 뒤, genome fasta + RNA long-read 입력만으로 바로 분석을 실행할 수 있습니다.

https://github.com/GenomiqueENS/egzotek