무작위 통합은 생각보다 복잡하다: Nanopore로 해독한 CHO Transgene 구조

Nanopore long-read로 CHO 세포주의 transgene 통합 위치를 완전히 해독하다.

– 무작위 통합(random integration)의 복잡성을 밝히다.

CHO(Chinese hamster ovary) 세포주는 단일클론 항체를 포함한 다양한 바이오의약품 생산의 핵심 플랫폼입니다. 그러나 대부분의 CHO 생산 세포주는 무작위 통합(random integration) 방식으로 생성되며, 이로 인해 transgene이 게놈의 어느 위치에, 어떤 구조로, 몇 개 복사본으로 들어갔는지 정확히 파악하기가 매우 어렵습니다.

특히, 발현 벡터는 종종 concatemer 구조(여러 복사본이 이어진 형태)로 통합되며, 이 구조는 단순한 tandem repeat뿐 아니라 서로 다른 방향(head-to-head, tail-to-tail)으로 결합된 벡터 조각(fragment)을 포함할 수 있습니다. 이러한 복잡성은 유전자 안정성 및 발현 변동성과 직접적으로 연결됩니다.

본 연구의 핵심은 단순한 Nanopore WGS가 아니라, CRISPR/Cas9 기반 타겟 농축 방법인 nCATS(nanopore Cas9-targeted sequencing)를 적용하여 integration locus 주변 DNA를 선택적으로 농축한 뒤, Nanopore long-read sequencing과 Canu de novo assembly를 결합해 전체 통합 구조를 재구성했다는 점입니다.

왜 기존 방법으로는 한계가 있었을까?

기존에는 다음과 같은 방법이 사용되었습니다:

Southern blot
transgene copy number 분석
cDNA sequencing
TLA-seq (Targeted Locus Amplification)

TLA-seq는 integration site를 single nucleotide 수준으로 식별할 수 있지만, vector-vector fusion 구조 전체를 완전히 해독하는 데에는 한계가 있습니다.

특히:

concatemer의 방향성
벡터 조각(fragment)의 크기
genome-vector 및 vector-vector junction의 정확한 연결 구조를 완전히 파악하기 어렵습니다.

Nanopore long-read sequencing은 최대 메가베이스 길이의 read를 생성할 수 있기 때문에, 이러한 복잡한 통합 구조를 한 번에 span할 수 있는 가능성을 제공합니다.

실험 방법 (Materials and Methods)

1. 세포주 개발

CHO-K1 세포(Glutamine synthetase 결손)를 사용하여, 단일 transfection vector(항체 heavy chain, light chain, GS 유전자 포함)를 전기천공법(electroporation)으로 도입했습니다. 무작위 통합 방식으로 transgene이 게놈에 삽입되었으며, 이후 단일 클론 선별을 통해 고생산 clone을 선택했습니다.

2. Whole Genome Sequencing (Illumina)

gDNA는 QIAsymphony + DSP DNA Mini Kit로 추출했으며, WGS는 Eurofins에서 수행되었습니다.

이는 Nanopore 결과와 비교하기 위한 데이터로 사용되었습니다.

3. TLA-seq 분석

5 × 10⁶개의 CHO 세포를 사용하여 TLA-seq 수행.

crosslinking
PCR amplification
Nextera XT 라이브러리 준비
NextSeq 550 (150 bp paired-end)

이 데이터를 통해 integration site 위치를 파악했습니다.

4. Southern blot

QIA Symphony DNA Midi Kit로 gDNA 추출
제한효소 처리
agarose gel 전기영동
DIG probe hybridization
ChemiDoc 시스템으로 검출

이는 Nanopore assembly 구조의 검증(validation) 용도로 사용되었습니다.

5. Nanopore sequencing

DNA 추출

여러 방법 비교:

Puregene Cell Kit
Monarch HMW DNA Kit
Nanobind CBB Big DNA Kit

최종적으로 Puregene protocol 1이 가장 높은 yield를 보여 선택되었습니다.

→ N50 read length: 30–37 kbp 범위.

라이브러리 준비

WGS: SQK-LSK110
Barcoding: EXP-NBD104 / NBD114
nCATS: Cas9 Sequencing Kit (SQK-CS9109m)

CRISPR guide RNA는 TLA-seq로 확인된 integration site의 상·하류 1 kb 지점에 설계되었습니다.

데이터 분석

NanoQC (품질 평가)
NanoFilt (Q > 8, 길이 > 1 kb 필터링)
minimap2로 CriGri-PICRH-1.0 hamster genome에 매핑
samtools로 vector read 추출
Canu(2.2)로 de novo assembly
Geneious Prime으로 annotation

일반 whole genome library와 비교했을 때, nCATS 적용 시 integration locus에 대한 on-target coverage가 22–37배 증가하였으며, 이로 인해 복잡한 concatemer 구조의 de novo assembly가 가능해졌습니다.

결과

Clone 1 – 비교적 단순한 통합

IgG 생산 CHO 세포주:

single integration site
3개 vector copy
모두 동일 방향 (tail-to-head)
일부 vector 끝은 truncated
heavy chain, light chain, GS 모두 보존

Canu assembly 결과:

49,049 bp 단일 contig
183 reads로 생성

Sanger 및 Southern blot으로 모든 breakpoint 검증 완료.

Clone 2 – 매우 복잡한 통합

Bispecific antibody 생산 세포주:

single integration site
7개 vector fragment
방향 혼합 (head-to-head, tail-to-tail)
fragment 길이 3.0–11.4 kbp
3 HC, 4 LC copy

Canu assembly 결과:

41,663 bp 단일 contig
22 reads 기반

특히 Southern blot의 복잡한 band pattern이 assembly 구조와 완전히 일치했습니다.

중요한 메시지

TLA-seq는 integration site 위치는 정확히 찾지만 vector-vector fusion 구조는 완전히 해독하기 어렵다.
Nanopore long-read는 concatemer 구조 전체를 한 번에 span 가능.
무작위 통합은 생각보다 훨씬 복잡하며 fragmentation, inversion, duplication이 빈번하다.
nCATS를 활용하면 WGS 대비 22–37배 높은 on-target coverage 확보 가능.

Figure 3은 TLA-seq와 nCATS 기반 Nanopore 시퀀싱 결과를 비교한 그림입니다.
상단(A)은 TLA-seq 결과이며, 하단(B)은 CRISPR/Cas9 기반 타겟 농축 방법인 nCATS를 적용한 Nanopore 시퀀싱 결과입니다.

TLA-seq 결과에서는 벡터에 결합하는 프라이머를 이용해 integration site를 정확히 찾을 수 있으며, 파란 삼각형으로 표시된 genomic breakpoint 위치를 명확히 확인할 수 있습니다. 그러나 coverage는 비교적 넓게 분포되어 있으며, 벡터 복사본의 전체 구조나 concatemer의 방향성까지는 완전히 해석하기 어렵습니다.

반면, nCATS 결과에서는 CRISPR guide RNA가 integration site의 상·하류 1 kb 지점에 설계되어 해당 부위를 절단하고, 그 구간을 선택적으로 농축하여 시퀀싱하였습니다. 그 결과 integration site 주변에서 coverage가 뚜렷하게 증가하며, 긴 Nanopore read를 통해 벡터와 게놈이 연결된 전체 구조를 재구성할 수 있습니다.

즉, TLA-seq는 integration 위치를 정확히 찾는 데 강점이 있으며, nCATS + Nanopore는 integration locus의 전체 구조를 해독하는 데 유리함을 보여주는 그림입니다.

그림 A는 Nanopore long-read 시퀀싱과 nCATS 기반 타겟 농축을 통해 재구성한 CHO 세포주의 transgene 통합 구조를 보여준다. 게놈(chr1)의 두 지점(67,522,652와 67,541,889) 사이에 총 7개의 벡터 조각(Vector Fragment, VF1–VF7)이 통합되어 있으며, 각 조각은 서로 다른 길이와 방향을 가진 복잡한 concatemer 구조를 형성하고 있다. 벡터 조각 내에는 heavy chain(HC), light chain(LC), glutamine synthetase(GS) 유전자 요소가 다양한 조합으로 포함되어 있으며, 일부는 truncated(부분 절단)된 상태로 존재한다. 이는 무작위 통합(random integration) 과정에서 벡터가 단순한 반복이 아닌 복잡한 재배열(rearrangement), 단편화(fragmentation), 방향 전환(head-to-head, tail-to-tail fusion)을 동반할 수 있음을 보여준다.

그림 B는 genome-vector 접합부(junction)를 Sanger sequencing으로 검증한 결과를 나타낸다. Nanopore 기반 de novo assembly로 예측한 breakpoint 위치가 Sanger 염기서열 분석 결과와 일치함을 확인함으로써, 재구성된 통합 구조의 정확성을 입증하였다.

Nanopore long-read와 nCATS를 결합하면 CHO 세포주의 복잡한 무작위 transgene 통합 구조를 전체 수준에서 해독할 수 있으며, 기존 short-read 기반 방법으로는 확인하기 어려운 concatemer 구조와 junction을 정밀하게 규명할 수 있다.

결론

본 연구는 처음으로 CHO 제조용 세포주의 전체 transgene integration locus를 완전히 해독했습니다.

Nanopore long-read sequencing은:

복잡한 concatemer 구조 분석
vector copy 수 정확 확인
genome-vector 및 vector-vector junction 규명
Southern blot 결과 해석 지원에 있어 강력한 도구임을 보여줍니다.

특히, 무작위 통합 기반 CHO 세포주의 유전적 복잡성을 이해하는 데 중요한 기술적 진전을 제시했습니다.

요약:

CHO 세포는 항체 의약품을 만드는 공장 세포입니다. 이 세포에 항체 유전자를 넣어서 약을 만들게 하는데, 문제는 이 유전자가 게놈 어디에 어떻게 들어갔는지 정확히 모른다는 것입니다.

기존 방식의 문제

보통은 이렇게 합니다:

항체 유전자를 세포에 “무작위(random)”로 넣음
세포가 알아서 게놈 아무 곳에나 붙임
여러 개 복사본이 뭉쳐서(concatemer) 들어가기도 함

그런데…

몇 개가 들어갔는지
어떤 방향으로 붙었는지
조각나서 들어갔는지
게놈이 같이 잘렸는지

이걸 정확히 알기 어렵습니다. 기존 방법(TLA-seq, Southern blot 등)은 “대략 어디에 들어갔다”는 건 알 수 있지만 전체 구조를 통째로 보는 건 어려웠습니다.

이 논문이 한 일

연구진은 이렇게 했습니다:

CRISPR로 통합 부위를 잘라서(enrichment)
Nanopore long-read로 아주 길게 읽고
Canu라는 프로그램으로 퍼즐처럼 이어 붙여서
전체 통합 구조를 완성

→ 즉, 유전자가 게놈에 어떻게 들어갔는지 처음부터 끝까지 전부 재구성한 것 입니다.

nCATS: "nanopore Cas9-targeted sequencing

CRISPR/Cas9을 이용해서 내가 원하는 DNA 구간만 잘라서, Nanopore로 집중적으로 읽는 기술입니다.

TLA-seq* vs nCATS + Nanopore

항목	TLA-seq	nCATS + Nanopore
integration site 찾기	매우 강함	가능
concatemer 전체 구조	제한적	완전 재구성 가능
read 길이	짦음 (illumina)	매우 김 (long-read)
구조 복잡성 해석	어려움	유리

* TLA = Targeted Locus Amplification

결과는 다음과 같았습니다.

Clone 1 (단순한 케이스)

벡터 3개가 들어감
거의 온전한 상태
같은 방향으로 정렬됨

비교적 깔끔한 구조

Clone 2 (복잡한 케이스)

벡터 조각이 7개
방향이 뒤집혀 있음 (head-to-head, tail-to-tail)
조각난 채로 붙어 있음
구조가 매우 복잡

→ 우리가 생각했던 것보다 훨씬 복잡하게 들어가 있음

왜 중요한가?

CHO 세포는 약을 만드는 공장인데 유전자가 이렇게 복잡하게 들어가 있으면:

발현이 불안정할 수 있고
생산성이 변할 수 있고
장기 배양 중 유전자 소실 가능성도 있음

즉, 세포의 안정성과 품질에 직접 영향을 줍니다.

핵심 메시지 한 줄

이 논문은 말합니다:

Nanopore long-read를 쓰면 CHO 세포에 들어간 항체 유전자의 전체 구조를 처음으로 완전히 볼 수 있다.
그리고, 무작위 통합은 생각보다 훨씬 복잡하다.

쉽게 비유하면

기존 방법은: 퍼즐 조각 몇 개 보고 그림을 추측하는 것

Nanopore는: 퍼즐을 통째로 펼쳐서 한 번에 보는 것 입니다.

왜 이게 업계에 중요할까?

규제기관에 더 정확한 구조 설명 가능
Southern blot 해석이 쉬워짐
clone selection 전략 개선 가능
장기 안정성 예측에 도움

https://www.sciencedirect.com/science/article/pii/S1871678423000079

추가 참고: Nanopore Cas9 기반 ISA 전략

본 글에서 다룬 CHO transgene 통합 구조 분석과 유사하게, PathoQuest에서는 Nanopore Cas9-Sequencing을 활용한 iDTECT® ISA 방법을 소개하고 있습니다.

해당 포스터는 통합 위치 좌표 확인뿐 아니라 벡터 구조, 복제 수, concatemer 여부까지 종합적으로 분석하는 전략을 제시합니다.

'나노포어 논문 > BioPharma' 카테고리의 다른 글

Unveiling Recombinant Cell Line Mysteries: Nanopore Cas9-Sequencing for Integration Site Analysis (ISA) in CHO Cells (0)	2025.12.24
[응용 사례] 나노포어 전장유전체 시퀀싱을 활용한 CHO 세포 기반 바이오의약품 생산 고도화 (0)	2025.12.24
왜 항체 생산에는 CHO 세포를 사용할까? (나노포어 활용도) (0)	2025.12.24
[응용 사례] Nanopore 기반 CHO Cell 클론 프로파일링 — Lonza 사례 분석 (0)	2025.12.01

무작위 통합은 생각보다 복잡하다: Nanopore로 해독한 CHO Transgene 구조

'나노포어 논문 > BioPharma' 카테고리의 다른 글

관련글

티스토리툴바