UPDATED. 2024-04-19 17:05 (금)
NGS(Next Generation Sequencing) 기반 유전자 검사의 이해(4)
NGS(Next Generation Sequencing) 기반 유전자 검사의 이해(4)
  • 온라인뉴스팀
  • 승인 2020.11.12 08:45
  • 댓글 0
이 기사를 공유합니다

NGS 검사의 임상적 응용 
출처:게티이미지뱅크
출처:게티이미지뱅크

지난편 NGS 결과 해석 및 품질 관리에 이어, 마지막편으로 NGS 검사의 임상적 응용에 대해 살펴보기로 한다. 

 

NGS 검사의 임상적 응용 

유전자 패널

여러 임상 검사실에서는 대부분 검사실 환경이나 임상의 요구도에 따라 맞춤형(custom) 패널을 직접 디자인하여 사용하며, 이 정보는 미국 국립생물공학정보센터의 Genetic Testing Registry (https://www.ncbi.nlm.nih.gov/gtr/)에서 확인할 수 있다.

다중유전자 패널 검사는 여러 유전자가 원인이 되는 다양한 질환에서 진단이 가능하여 비용효율이 높은 검사이다. 여기에는 유전성 질환, 혈액종양, 암 질환 들이 해당된다.

유전성 질환(Germ-line, hereditary)과 관련해 유전성 암 증후군(hereditary cancer syndrome), 뇌신경 발달 질환(neurodevelopmental disorders), 유전성 안질환(eye disorder), 청각 소실(hearing loss) 및 난청, 심혈관질환(cardiovascular disorders), 신경근육병증(neuromuscular disorders), 기형 증후군(dysmorphic syndrome), 근골격계이상(skeletal disorder) 등 다양한 유전질환에서 NGS 검사가 활용될 수 있다. 

암 체세포(Somatic) 돌연변이와 관련하여서는 급성 골수성 백혈병(acute myeloid leukemia, AML), 급성 림프모구성 백혈병(acute lymphoblastic leukemia, ALL), 골수 이형성 증후군(myelodysplastic syndrome) 및 골수 증식 증후군(myeloproliferative neoplasm) 등 다양한 혈액종양에서 NGS 검사가 도움이 될 수 있다.

또한 고형암(solid cancer)에서도 다양한 표적 치료제 반응(예. EGFR, BRAF, ERBB2, ALK, ROS1, RET, NTRK 등)과 내성(예.KRAS 돌연변이)을 예측할 수 있으며 면역 항암 치료 반응을 예측하는 microsatellite instability(MSI), 총 돌연변이 수(tumor mutation burden) 등의 검출 등을 해볼 수 있다.

 

엑솜(Exome) 및 전장유전체(whole genome) 시퀀싱

엑솜은 전체 유전체 중 2만여 개에 달하는 유전자의 단백질을 코딩하는 부위인 엑손(exon)을 모두 분석하는 것으로서 분석 부위의 총 크기는 약 30 mega base pair(Mb) 정도 되며 이것은 전체 유전체의 1~2% 정도밖에 되지 않는다.

질환과 연관성이 알려진 변이의 대부분은 엑손 부위에 돌연변이가 발생하기 때문에 엑솜 분석은 유전체를 분석하는 전장유전체 시퀀싱(whole-genome sequencing)과 비교했을 때 소요 시간및 분석 비용이 줄어들어 효율적이다.

NGS 다중유전자(multi-gene) 패널, 즉 타겟유전자(target-gene) 패널의 경우 타겟에 포함된 유전자의 변이만 검출이 가능한데 비하여 엑솜 시퀀싱을 시행할 경우 타겟유전자 패널에 비해 진단율이 높고 질환과의 연관성이 잘 알려지지 않았던 유전자의 발굴이 가능하다. 

엑솜은 타겟유전자 패널에 비교해서는 시퀀싱 깊이(depth of coverage)가 낮아져 정확도가 떨어질 수 있는 단점이 있으며, 분석 유전자 수가 많아 의미가 불명확한 변이(variant of unknown significance, VOUS)가 많이 검출되어 해석이 어려울 수 있다.

또한 전체 유전자를 검사하는 것이기 때문에 보고자 했던 유전자 이 외에 다른 유전자에서 예기치 않게 돌연변이(incidental finding)가 발견될 가능성이 있다. 예를 들어, 신경근육 질환과 관련된 유전자를 보고자 엑솜 시퀀싱을 하였는데 우연히 유전성 암 관련 유전자인 BRCA1 등 유전자에서 돌연변이가 추가로 나올 수 있다.

일부 유전자는 추가로 발견된 검사 결과를 환자에게 알려 주는 것이 환자의 추후 질환의 예방이나 가족 검사로 인한 이익 등이 있을 수 있기 때문에, 미국의학유전학회(American College of Medical Genetics, ACMG) 가이드라인에서는 우연히 발견된 돌연변이 중 환자에게 알려줄 필요가 있는 유전자들을 제시하고 있다.

 

단일염기다형성(SNP) 검출

단일염기다형성(Single nucleotide polymorphisms, SNP)이란 정상인에서 관찰될 수 있는, 대개는 단백질의 기능이나 건강에 큰 영향을 미치지 않는 염기 한두 개 정도의 변화로서 유전체 전 범위에 분포하며 평균적으로 1,000개 염기(base-pair)마다 하나씩 존재한다.

몇몇 SNP 들은 특정 약물의 대사와 연관이 있기도 하고 특정 질환의 위험도를 예측하는데 연관분석(association study)을 통해 질환의 발생과 통계적 연관성이 확인되어 심혈관 질환, 당뇨병, 암과 같은 복잡한 질환의 기전을 연구하는데 도움이 되기도 한다.

SNP도 개인식별에 이용될 수 있으며 50개 정도 이상의 SNP를 이용하면 대부분의 사람을 구분할 수 있게 되며 NGS 법은 이러한 SNP 검사에 활용될 수 있다. 또한 조혈모세포나 고형 장기를 이식한 후에는 이식을 받은 수혜자(recipient)의 조직에서 공여자(donor)의 조직 비율인 키메리즘(chimerism)을 모니터링하는 것이 중요할 수 있는데 이것도 역시 NGS를 이용한 SNP 검사로 확인할 수 있다.

 

혈액기반 종양 검사(Blood-based tumor diagnostics)

액체생검(liquid biopsy)이란 혈액, 소변, 뇌척수액, 타액, 흉강액 등을 이용하여 종양을 진단하는 것으로 주로 혈액 기반의 검사가 많다.

혈액에 존재하는 핵산(circulating nucleic acid)는 최근 여러 분자 기법의 발전으로 검사의 적용이 늘고 있으며 혈중 DNA, RNA 검사를 포함한다. 엑소좀(exosome)은 정상 혹은 종양세포로부터 분비되는 낭포(vesicle)로서 DNA, 메신저 RNA(messenger RNA), 마이크로 RNA(micro RNA), 세포내 단백질 등 다양한 물질을 풍부하게 함유하고 있어 이를 분리하여 분석하면 암의 발병기전을 규명하고 진단 및 치료제 선택, 모니터링 등에 이용될 수 있다.

순환 세포유리 DNA(Circulating cell-free DNA, cfDNA)는 혈액에서 세포 밖 혈장(plasma)에 존재하는 DNA로서 보통 세포가 손상을 받아 깨지면서 혈액으로 방출된 것들이다. 암세포에서도 세포유리 DNA를 방출하며 이것을 순환 종양 DNA(circulating tumor DNA, ctDNA)라 부르며, 정상 세포에서 비롯된 세포유리 DNA가 순환 종양 DNA를 희석시키기 때문에 순환 종양 DNA의 농도가 상대적으로 낮은 경우가 많아 민감도 높은 검사법이 필요한 경우가 많다.

순환 암세포 DNA의 검사는 암의 진단, 치료제 선택, 예후 예측, 치료 모니터링 등에 활용할 수 있다.

 

비침습적 산전검사(Noninvasive prenatal testing, NIPT)

1990년대 산모의 혈액에 태아의 DNA가 세포 유리 DNA(cell-free fetal DNA) 형태로 존재함이 밝혀지면서 태아의 유전 이상을 산모의 혈액을 통해 검사하려는 노력이 계속되고 있으며 이를 비침습적 산전검사(noninvasive prenatal testing, NIPT)라 부른다.

태아 세포유리 DNA를 NGS 법으로 검사하는 것이 태아의 염색체 이상을 검출하는 데 있어 민감도와 특이도가 99% 이상 되는 것으로 보고되면서 최근 그 적용이 계속 늘고 있다.

NGS를 이용한 NIPT 검사는 보통 전장유전체 시퀀싱(whole genome sequencing)을 아주 낮은 정도로 하여 염색체별로 시퀀싱 리드 수를 합산하여 비교하는 방식으로 한다. 각 염색체의 총 시퀀싱 리드 수는 다른 염색체의 시퀀싱 리드와 정상 태아를 임신한 대조군(control) 산모의 데이터를 이용하여 값을 표준화하여 임계치를 넘으면(예. 3SD 이상) 양성으로 간주한다.

 

인간백혈구항원(Human leukocyte antigen, HLA) 

인간백혈구항원(Human leukocyte antigen, HLA)은 백혈구 표면에 존재하는 단백질로서 사람마다 다양한 타입의 유전자 서열을 가지고 있어 단백질 서열이 다르며 이에 따라 개인마다 다른 항원성(antigen)을 가진다.

장기이식, 특히 조혈모세포이식(hematopoietic stem cell transplantation)을 할 경우 공여자(donor)와 수혜자(recipient)의 항원 타입이 다르면 수혜자의 면역 시스템에서 이를 인지하고 거부반응을 일으킨다. 따라서 이식 전에 수혜자의 HLA 타입과 일치하는 공여자를 찾는 것이 중요하다.

직접염기서열분석을 통한 HLA 검사는 2개의 대립유전자(allele)가 같이 PCR 증폭되고 전기영동이 되기 때문에 검사 자체로 각각의 대립유전자를 분리해내는 것이 불가능하여 기존의 HLA 유전형 데이터 베이스를 이용하여 유추하는 방법으로 유전형을 추정한다. NGS 방법은 DNA 가닥을 일일이 분석하기때문에 각각의 대립유전자를 분리할 수 있고 더욱 정확한 유전형을 알 수 있다.

 

면역글로불린 유전자 재조합(Immunoglobulin rearrangement)

B 세포의 발생과 성숙 과정에서 면역글로불린(immunoglobulin) 유전자 중쇄(heavy chain, IGH) 및 경쇄(light chain, IGK)의 재조합(rearrangement)이 일어나게 되며, 개개의 세포마다 다른 종류와 길이의 재조합이 일어난다.

B-림프구성 백혈병(B-lymphoblastic leukemia)이나 B-림프종(B-cell lymphoma) 등의 암종은 하나의 암 세포에서 기원하기 때문에 동일한 형태의 재조합을 거의 모든 세포가 가지게 되어 PCR 증폭하면 동일한 크기와 염기서열을 가진 증폭산물이 생성되고 이를 단클론성(monoclonal)이라 하며 종양 세포의 존재를 시사하는 결과이다. 이것은 또한 NGS로 검사가 가능하며 이는 유전자 재조합이 일어난 부분의 염기서열을 분석하여 특정 염기서열이 과도하게 높은 비율로 관찰되면 단클론성으로 판단하는 방식이다. 

NGS 방식은 크기가 동일하여도 염기서열의 차이를 구분하기 때문에 해상도와 특이도가 높고 민감하게 검사할 수 있는 장점이 있다.

 

RNA 시퀀싱(RNA-sequencing, RNA-Seq)

RNA 가닥을 NGS에 적합한 라이브러리를 만들어 시퀀싱을 하는 것을 RNA 시퀀싱(RNA sequencing, RNA-Seq)이라 부른다. 

RNA 시퀀싱으로 단백질을 합성하는 메신저 RNA(messenger RNA, mRNA)의 발현(expression)과 일부 돌연변이를 확인할 수 있으며, 이외에 단백질을 합성하지 않는 논코딩(non-coding) RNA도 검사가 가능하다. 논코딩 RNA 중 마이크로 RNA(micro RNA, miRNA)와 같이 20 bp 내외의 작은 크기의 RNA도 NGS로 효과적으로 검사가 가능하며 이것을 small RNA-Seq이라 부른다.

또한 NGS를 이용한 전사체 RNA 분석을 하면 융합유전자(fusion gene)를 검출할 수 있고 예상하지 않았던 재조합 유전자나 절단점(breakpoint)을 가진 재조합도 검출할 수 있다.

RNA는 변성되기 쉽기 때문에 라이브러리를 제작할 때에는 RNA에 상보적인 DNA(complementary DNA, cDNA)로 합성하는 과정이 필요하다. cDNA가 만들어진 후에 진행되는 라이브러리 제작과 시퀀싱 단계는 DNA 시퀀싱과 동일하다.

 

DNA 메틸화(methylation) 

DNA 메틸화(methylation)은 후성유전학적(epigenetic) 변화 중 대표적인 것으로서 주로 사이토신(cytosine)의 5번 탄소에 메틸기(-CH3)가 붙어 5-methylcytosine 형태로 변형되는 것이다. DNA 메틸화의 이상이 생기면 프레더윌리(Prader-Willi) 증후군, 엔젤만(Angelman) 증후군과 같은 유전성 질환을 일으킬 수 있다.

암세포에서는 암 억제 유전자(tumor suppressor gene)의 프로모터 부위가 비정상적으로 과메틸화(hypermethylation)되어 유전자의 발현(expression)을 억제시켜 암 발생에 영향을 주거나, 암 활성화 유전자(proto-oncogene)의 저메틸화(hypomethylation)가 일어나 유전자의 발현이 증가하여 또한 암 발생을 촉진시킬 수도 있다.

NGS를 이용한 DNA 메틸화 검사는 MSRE, MeDIP, bisulfite 등이 이용될 수 있으며 bisulfie 법은 가장 많이 사용되는 방법으로 DNA 염기서열 중 사이토신(cytosine)을 우라실(uracil)로 변환(conversion)시키는 방법이다.

Bisulfite는 특이적으로 메틸화된 사이토신은 우라실로 변환시키지 않는 특성을 가지기 때문에 NGS 분석으로 타겟 부위의 염기서열이 변환된 정도를 확인하여 메틸화 여부와 정도를 알 수 있다.

 

Chromatin immunoprecipitation(ChIP) 시퀀싱

Chromatin immunoprecipitation(ChIP)은 살아있는 세포에서 특정 단백질이 결합하는 DNA 부분을 해당 단백질의 항체를 이용해 선택적으로 농축하는 실험 방법으로 단백질과 DNA의 상호작용을 분석하는데 활용될 수 있다.

ChIP sequencing(ChIP-Seq)은 농축된 단백질에 결합된 DNA를 추출하여 NGS를 통해 분석하는 방식으로 시퀀싱 깊이(depth)가 높게 나오는 부위가 해당 단백질의 결합부위(binding site)라 추측해볼 수 있다.

ChIP-Seq 법으로 분석할 수 있는 단백질에는 전사 조절 인자(transcript factor), 활성자(activator), 억제자(repressor), 구조 단백질 등이 있으며, 결합부위 분석을 통해 전체 유전체에서 그들의 새로운 타겟 위치를 찾거나 결합부위의 염기서열을 분석하여 해당 단백질이 인식하는 염기서열 모티프(motif)를 찾을 수도 있다.

 

단일세포 시퀀싱(Single cell sequencing)

단일세포 시퀀싱(Single cell sequencing)은 세포 하나하나의 유전체를 분석하는 방법으로 세포마다 다른 고유한 유전적 변이를 규명할 수 있다.

특히 순환종양세포(circulating tumor cell), 종양 생검 조직(tissue biopsy), 줄기세포(stem cell) 등과 같이 샘플의 양이 적은 경우나 다양한 클론(clone)을 규명하는 것이 중요할 때 사용될 수 있으며, 전장 유전체 시퀀싱뿐 아니라 전사 유전체와 후성유전체 등 다양한 방법을 이용하여 연구할 수 있다.

가장 많이 사용하는 microdroplets 법은 세포들이 미세한 방울에 하나씩 들어가도록 자동 조정되고 이후의 모든 라이브러리 제작 반응이 그 안에서 일어나는 방식이며, 각각의 방울에 있는 세포를 구분하기 위해 방울 안에 있는 라이브러리는 서로 다른 분자바코드(unique molecular identifier, UMI)로 구분된다.

 

미생물 분야에서 NGS 활용

NGS 검사는 병원균의 완전한 유전체 정보를 얻을 수 있기 때문에 병원균의 내성 및 독성 관련 돌연변이 혹은 유전형에 대한 정보를 얻을 수 있으며, 유전체 정보로 병원균의 발병(outbreak)에 대한 역학(epidemiology) 조사를 할 수 있다.

메타지놈(metagenome) 분석을 통해 배양을 하지 않고 원래의 검체 안의 세균들의 조성을 확인할 수 있으며, 특히 세균은 16S 유전자가 공통적으로 존재하지만 균종 별로 다양성이 크기 때문에 이를 증폭하여 NGS 분석을 함으로써 손쉽게 균종 분포 정보를 얻을 수 있다.

미생물은 표준 염기서열이 없는 경우가 많기 때문에 시퀀싱 리드를 조합하여 균의 염기서열을 추정하는 새로운 조립(de novo assembly) 알고리즘을 사용한다. 여기에는 짧은 DNA 조각의 염기서열 정보를 묶어 이어 붙이는 과정이 필요한데 일루미나(Illumina) 장비와 같이 짧은 시퀀싱 리드를 가진 장비에서 얻은 데이터는 각 염기의 정확도는 높으나 새로운 조립 과정에서 컨티그끼리 이어지지 않는 부위가 생길 가능성이 높은 반면 옥스포드 나노포어(Oxford Nanopore) 혹은 퍼시픽바이오사이언스(Pacific Biosciences) 등 3세대 장비는 개별 염기의 정확도는 떨어지지만 긴 시퀀싱 리드를 생산하기 때문에 틈이 없이 컨티그를 만드는 데 유리하다.

단일 균주가 아닌 여러 균주의 분포 상태를 보는 것을 메타지놈(metagenome) 분석이라 하고, 미생물을 배양하지 않고 샘플에서 직접 DNA를 추출하고 샘플 안에 있는 전체 균주의 유전정보를 획득하는 방법으로 배양이 불가능한 균도 확인할 수 있고 군집의 미생물 구성적 특성을 알게 됨에 따라 질병 또는 환경과의 연관성을 연구할 수 있다.

메타지놈 분석에는 16S 리보좀 RNA(rRNA) 분석을 많이 이용하고 있는데 이 유전자는 약 1500 bp 정도의 크기이며, 여기에는 균종마다 다르고 변동성(variability)이 큰 부위(variable region)가 존재한다. 이러한 변동성 부위 사이에는 균종에 상관없이 염기서열이 동일한 부위(constant region)가 존재하는데 이 부위에 맞추어 모든 균이 공통적으로 증폭될 수 있는 프라이머(universal primer)를 고안하여 PCR 증폭을 하여 NGS 분석을 할 수 있다.

NGS는 한번에 많은 타겟을 분석할 수 있다는 장점 때문에 다양한 종류 혹은 미지의 바이러스를 검출하는데 이용될 수 있다. 또한 항생제 및 항바이러스제 치료에 대한 내성과 관련된 돌연변이를 효과적으로 검출할 수 있다.

 

향후 전망

NGS 기술이 도입되면서 염기서열 분석은 비약적인 발전을 하였으며 다양한 유전정보를 정확하게 얻음으로써 질환의 원인 규명과 환자의 진단에 큰 도움을 받고 있다. 하지만 NGS 결과 발견된 수많은 유전변이의 임상적 의미에 대한 해석이 큰 숙제가 되고 있으며 환자들에 대한 결과에 대한 설명과 유전상담도 점차 중요해지고 있다.

또한 대량의 데이터의 분석, 저장, 해석 등의 중요성이 훨씬 커지고 있으며, 딥러닝(deep learning), 블록체인(blockchain) 등 새로운 데이터 분석 및 교환 기법이 시도되고 있어 앞으로 4차 산업혁명과의 접목이 확대될 것으로 예상된다.

 

(*"이 「차세대염기서열분석 해설서」는 식품의약품안전처에서 수행한 연구사업인 「바이오의약품 허가심사 역량강화를 위한 NGS 기술 기반 유전체 검사법 조사연구」(연세대학교 이승태 2019) 연구를 수행하며 획득한 정보를 관련 분야 연구자와 심사관련 종사자에게 제공하기 위한 목적으로 작성되었다. 여기에 제시된 정보는 앞으로 관련 분야의 과학기술 발전에 따라 변경될 수 있으며, 식약처의 정책이나 심사 방향과는 다를 수 있음을 밝힌다.")

-끝-

[바이오타임즈=온라인뉴스팀] webmaster@biotimes.co.kr



댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.