https://github.com/Kirk3gaard/2025-Crowdsource-GPU-basecalling-stats
GitHub - Kirk3gaard/2025-Crowdsource-GPU-basecalling-stats: A repository for collecting GPU basecalling stats
A repository for collecting GPU basecalling stats. Contribute to Kirk3gaard/2025-Crowdsource-GPU-basecalling-stats development by creating an account on GitHub.
github.com
Dorado 기반 나노포어 베이스콜링을 위한 GPU 성능 비교 자료가 공개되었습니다.
PromethION 유저부터 연구실에서 적절한 GPU를 고르려는 분들까지, 이 그래프 하나면 충분히 판단하실 수 있습니다.
목표 (Aim)
이 자료는 특정 GPU를 사용할 때 나노포어 베이스콜링(Dorado 기준)이 얼마나 빠른 속도로 처리되는지 시각화해 보여줍니다. 즉, "이 GPU로 하루에 몇 Gbp까지 처리할 수 있지?"라는 질문에 대한 답입니다.
기여하는 방법 (How to contribute?)
- Zenodo에서 5kHz pod5 데이터를 다운로드
- Dorado 다운로드
- 다음 명령어로 베이스콜 수행:
- dorado basecaller --device 'cuda:0' sup pod5/ > basecalls.bam
- 결과를 구글 폼에 업로드
GPU별 베이스콜링 성능 (Basecalling performance)
- 빨간 점선: PromethION에서 1개 플로우셀 (150 Gbp/72시간)을 커버하기 위해 필요한 속도
- 파란 점선: 2개 플로우셀 커버 기준
주요 포인트:
- 최고 성능:
- NVIDIA H100 (101 Gbp/day)
- RTX 5090 (99 Gbp/day)
- PromethION 1플로우셀 커버 가능한 최소 사양:
- RTX 4070 Ti (32 Gbp/day)
- RTX 4070 (30 Gbp/day)
데이터 확인 (Data availability)
전체 데이터는 이 구글 시트에서 확인하실 수 있어요.
계속해서 사용자들이 결과를 업로드하면서 업데이트되고 있습니다.
GPU 세대 | 추천 GPU | 이유 |
Ampere | A100, A6000 | 효율 좋고 성능 우수 |
Ada Lovelace | RTX 4090, 4070 Ti | PromethION 커버 가능, 가격 대비 성능 좋음 |
Hopper | H100 | 최고 사양, 대규모 프로젝트에 적합 |
Blackwell | RTX 5090, 5080 | 최신 세대, 미래지향적 선택 |
결론:
PromethION을 안정적으로 커버하려면 최소 RTX 4070 이상을 고려하세요. 효율성과 예산을 고려해 GPU를 선택하시면 됩니다. 베이스콜링 성능을 최대한 끌어올리고 싶다면 H100 또는 RTX 5090이 정답입니다.
https://github.com/Kirk3gaard/2025-Crowdsource-GPU-basecalling-stats
'꼭 알아두어야하는 사항' 카테고리의 다른 글
MinKNOW 소프트웨어 업데이트 (25.03.7) (0) | 2025.04.22 |
---|---|
윈도우에서 MinKNOW Basecalling 속도 저하 문제 해결 방안 (0) | 2025.03.13 |