top of page

영국의 제약 회사 글락소스미스클라인의 차세대 의약품 개발에 Kinetica를 쓰는 이유

제약 업계는 인공 지능에 미래를 걸고 있는 대표적인 업종입니다. 신약 개발은 긴 시간과 막대한 투자가 들어가는 대형 프로젝트입니다. 신약의 성공을 100% 보장하기도 어렵습니다. 그렇다고 신약 개발을 하지 않고 복제약만 생산할 수는 없습니다. 이런 이유로 세계적인 제약사는 인공 지능과 첨단 분석을 앞세워 디지털 트랜스포메이션에 나서고 있습니다.

오늘 소개할 클락소스미스클라인(이하 GSK)의 사례는 첨단 분석을 위한 바른 인프라 활용법으로 유명합니다. GSK는 1830년 설립된 세계적인 영국 제약 회사입니다. 총매출 기준으로 세계 3위 제약사라고 하면 그 규모와 영향력이 더 가깝게 느껴질 것입니다. GSK는 전통적인 신약 개발 방식으로는 지속 가능한 성장이 어렵다고 봤습니다. 신약 하나 개발하는데 평균 16억 달러가 든다고 합니다. 개발 기간은 6~9년 정도 걸리는데, 개발된 신약 중 90% 정도가 제품으로 시장에서 성공하지 못한다고 합니다. GSK는 GPU 기반 컴퓨팅 환경에서 첨단 분석과 머신 러닝을 수행해 전통적인 신약 개발 방식을 바꾸는 여정에 올랐습니다.


GSK는 12만 5천 개의 GPU 코어로 구성된 대규모 클러스터를 운영해왔습니다. GPU 인프라는 신약 개발 관련 각종 시뮬레이션 작업을 위한 소프트웨어를 더 효율적으로 쓰기 위해서 구축한 것이었습니다. 문제는 GPU 인프라의 활용도가 생각보다 떨어졌다는 것입니다. 쉽게 말해 시뮬레이션 작업만 돌리기에는 남아도는 성능이 아까웠던 것이죠.

"어떻게 하면 GPU 인프라의 활용도를 높일 수 있을까?" 이 고민에 대한 답은 쉽게 찾을 수 있었습니다. GPU 가속 기반 데이터베이스 솔루션인 Kinetica를 사용하면 현재 구축한 GPU 인프라에 다양한 유형의 작업을 돌릴 수 있다는 것을 안 GSK는 바로 도입을 진행합니다.

GSK가 Kinetica를 보고 "바로 이것이다!"라고 외친 것은 어렵게 병렬 컴퓨팅 환경에 최적화된 코드를 짜거나 GPU 전용 솔루션을 도입하지 않아도 데이터 과학자와 분석가를 지원할 길이 있기 때문이었습니다. 실제로 Kinetica를 도입한 다음 보니 GSK의 데이터 과학자와 분석가는 관계형 데이터베이스 다루듯이 SQL 문으로 원하는 작업들을 척척해냈습니다. 무엇이나 새로 개발하거나, 새로운 언어를 사용할 필요 없이 GPU 인프라의 막강한 파워를 누릴 수 있게 된 것이죠.

GSK는 현재 Kinetica를 활용한 머신 러닝 등 새로운 유형의 알고리즘을 사용할 수 있게 된 것도 반가워하고 있습니다. Kinetica가 제공하는 UDF(User-Defined Functions)를 사용하면 데이터 과학자와 분석가는 자신이 손에 익은 방식을 사용해 모델을 개발해 배포할 수 있습니다.



Kinetica 도입 후 데이터 과학자와 분석가는 빨라진 쿼리 처리 속도에 놀랐습니다. 평소 쓰던 쿼리를 수행해 보니 75~100배 가까이 처리 속도가 빨라졌습니다. GSK는 Kinetica를 통해 느린 쿼리 처리 속도에 대한 데이터 과학자와 분석가의 불만을 해결했고, 그다음 과제로 실시간 스트리밍 데이터를 처리할 수 있는 수준의 머신 러닝 수행에 도전할 계획입니다. 이 역시 Kinetica를 믿고 하는 도전입니다. 이를 통해 신약 개발 관련 시간, 비용 절감이라는 궁극의 목표에 한걸음 더 도달한다는 것, 이것이 바로 GSK가 Kinetica를 사용하는 이유입니다.


조회수 178회댓글 0개
bottom of page