NVIDIA Clara Parabricks는 유전자 검사와 분석 현장의 요구를 수용하기 위해 NVIDIA가 CUDA, HPC, AI, 데이터 분석 스택 기술을 적용해 DNA 연구에 최적화한 프레임워크입니다. 이를 이용하면 전체 게놈 DNA 염기 서열 분석을 단 20분 내에 수행할 수 있을 정도로 연구 속도와 효율을 높일 수 있습니다. 

NVIDIA Clara Parabricks

DNA 분석 및 연구를 가속하는 프레임워크인 NVIDIA Clara Parabricks에 대한 관심이 커지고 있습니다. NVIDIA Clara Parabricks는 다음 두 요소로 구성됩니다. 

  • NVIDIA Clara Parabricks Pipeline: DNA 염기서열 분석, RNA 염기서열 연구 가속을 위한 GPU 기반 분석 파이프라인을 실행하는 역할을 하는 요소입니다. 몇몇 샘플이 아니라 인구 단위같이 대규모 분석을 할 때 가속의 이점이 극대화됩니다. 가령 유행병이 돌 때 GPU 가속 RNA 시퀀싱 파이프라인을 이용하면 연구원들은 질병 감염성, 치료에 대한 반응 등에 대한 중요한 통찰력을 적시에 확보할 수 있습니다. 

  • NVIDIA Clara Parabricks Toolkit: CUDA 라이브러리, 딥 러닝 모듈, C++, Python API, 참조 응용 프로그램 및 워크플로우 통합으로 유전체 연구자가 자신에게 필요한 도구 환경을  손쉽게 구축할 수 있도록 돕습니다. 

NVIDIA Clara Parabricks Pipeline

NVIDIA Clara Parabricks Pipeline은 Broad Institute의 GATK(Genome Analysis Toolkit)을 기반으로 합니다. 현재 GATK v4.1을 지원합니다. NVIDIA Clara Parabricks Pipeline은 DNA 생식 세포 변이, 체세포 변이, RNA 염기서열 분석 등을 더 빠르고 효율적으로 처리합니다. 이 파이프라인을 적용하면 로우 데이터를 연구자의 요구에 맞게 손쉽게 변환할 수 있으며, 연구자는 자신이 원하는 특정 도구를 사용해 분석 파이프라인이 실행할 수 있습니다.

NVIDIA Clara Parabricks Pipeline은 버전을 거듭하면서 빠른 개선이 이루어지고 있습니다. 최신 버전은 v3.0으로 주목할 기능 개선은 다음과 같습니다. 

  • 성능 개선: ​NVIDIA A100 TensorCore GPU 기반 시스템에서 실행할 경우 DNA 생식 세포 변이 분석 성능이 2배 더 높아집니다. 일례로 NVIDIA는 코로나19 연구원들을 위한 90일 무료 라이선스 버전의 NVIDIA Clara Parabricks을 제공합니다. 이를 이용한 팀 중 전체 게놈 DNA 염기 서열 분석을 단 20분 내에 수행하는 신기록을 달성한 곳도 있습니다. 또한, 새롭게 추가된 RNA-Seq Single Cell Pipeline으로 성능을 10배 이상 끌어올렸습니다. 참고로 이 수치는 RNA-Seq Single Cell Pipeline 적용 전과 후 GATK4.1 버전의 베스트 프랙틱스 실행 결과를 비교해 도출한 것입니다. 이 밖에도 DeepGermline Pipeline을 써드파티 도구인 Google DeepVariant v0.10에 최적화하여 이 도구를 쓸 경우 런타임 실행 시간을 5시간에서 40분으로 줄일 수 있습니다. 

  • 비용 절감: NVIDIA V100 및 NVIDIA T4 기반 인스턴스를 이용할 때 클라우드 비용을 30% 이상 절감할 수 있도록 소프트웨어를 최적화하였습니다. 

NVIDIA Clara Parabricks Toolkit

NVIDIA Clara Parabricks Toolkit은 NVIDIA가 지원하는 엣지 라이브러리, 참조 워크플로우, 오픈 소스 및 써드파티 애플리케이션을 하나의 도구 패키지에 모은 것입니다. 사전에 충분한 검증 과정을 거쳐 유전체 연구원은 도입 즉시 바로 연구에 활용하면 됩니다. 유전체 연구원은 NVIDIA Clara Parabricks Toolkit을 이용해 AI 워크플로우를 만들고, 별도의 레퍼런스 세포가 없는 게놈(de novo genome)에 대한 맵핑, 얼라이닝, 폴리싱 작업을 최적화할 수 있습니다. 이를 통해 부족한 정보의 한계를 넘어 해상도 높은 후성유전학(epigenetics) 분석 결과를 끌어낼 수 있습니다. 

주소: 서울특별시 중구 퇴계로 286 쌍림빌딩 8/9층 (주)유클릭 AI 사업본부

전화: 02-6320-0121

© 2030 by uDNA & Uclick

  • 블랙 블로거 아이콘