AI/ML 개발은 점점 더 큰 컴퓨팅 자원을 요구하고 있습니다. 데이터 과학자와 개발자는 모델의 정확도를 높이기 위해 훈련과 조정을 거듭합니다. 작업 빈도만 많은 게 아닙니다. 최근 추세는 더 복잡한 알고리즘, 더 큰 데이터 세트를 활용하는 것입니다. 그러다 보니 AI 개발은 날이 갈수록 더 많은 리소스를 요구하는 작업이 되어 가고 있습니다.
고가의 GPU 인프라, 투자 못지 않게 최적화도 중요
AI 인프라는 매우 큰 투자 대상입니다. 따라서 수요에 맞게 확장하는 것 못지않게 보유 자원의 활용률(Utilization)을 높이는 것이 중요합니다. 관련해 많은 조직이 주목하는 것이 MLOps 파이프라인입니다. 하드웨어와 소프트웨어 환경의 조화를 통해 데이터 과학자와 개발자에게 유연하게 자원을 할당하고 회수하여 개발 생산성과 함께 자원 효율성을 모두 높이기 위한 방법으로 MLOps에 주목하는 것이죠.
DGX 소프트웨어 스택과 MLOps의 조화
MLOps의 혜택은 매우 또렷이 볼 수 있습니다. 하지만 직접 구축하는 것은 꽤 난이도 높은 일입니다. 하드웨어, 소프트웨어 스택 모두에 대한 이해가 필요하고 AI/ML 워크플로우 특성도 잘 알아야 합니다. 다행히 NVIDIA가 제공하는 DGX 소프트웨어 스택과 DTX Ready Software를 이용하면 MLOps를 위한 하드웨어와 소프트웨어 환경을 수월하게 마련할 수 있습니다.
DTX Ready Software ~
다음 그림을 보시죠. DGX 소프트웨어 스택과 DGX Ready Software를 활용해 MLOps 체계를 완성한 예입니다. MLOps 구현을 위한 다양한 도구를 어떻게 적용해야 할지 걱정 없이 DGX 시스템, DGX 소프트웨어 스택, 엔터프라이즈 컨테이너 플랫폼을 MLOps 환경과 통합할 수 있습니다. 이처럼 쉽게 연계할 수 있는 이유는? NVIDIA가 사전 평가를 통해 DGX 시스템, 소프트웨어 스택과 연계 및 통합에 대한 검증과 인증을 마쳤기 때문입니다. 이 중 하나가 최근 유클릭이 국내 시장에 소개하고 있는 Run:AI입니다. Run:AI 및 다른 DGX Ready Software를 활용한 MLOps 구축이 궁금하시면? 유클릭은 연락 부탁합니다.
Comments