환상의 조합 - Red Hat OpenShift + cnvrg.io
컨테이너에 관심 있는 분이라면 레드햇 OpenShift 플랫폼을 들어 봤을 것입니다. 레드햇 OpenShift는 기업이 간편하게 PaaS 기반의 컨테이너 관리 환경을 구축할 수 있도록 돕습니다. 레드햇 OpenShift는 오픈 소스 기반 솔루션이지만 레드햇이 철저한 사전 검증과 평가를 거쳐 제공하며, 안정적인 기술 지원을 보장합니다. 커뮤니티 버전 사용 시 기업이 느끼는 최적화, 운영, 보안, 유지보수 등의 문제를 레드햇이 해결한 솔루션이라 보면 됩니다. 레드햇 OpenShift를 이용하면 컨테이너 기반 애플리케이션을 물리적 인프라, 가상화 인프라, 공용 클라우드에 손쉽게 배포 및 운영할 수 있습니다. 또한 CI/CD 파이프라인 구축도 간편해서 개발, 배포, 운영을 인프라 환경에 구애받지 않고 일관성 있게 할 수 있다는 장점을 제공합니다. 간단히 이야기해 도커를 지원하는 표준화된 컨테이너 관리 플랫폼을 이용해 DevOps 체계를 마련하여 온프레미스와 멀티 클라우드를 아우르는 PaaS 환경을 구축할 수 있도록 돕는 것이 레드햇 OpenShift입니다.

DGX 소프트웨어 스택의 완성 - RHEL, OpenShift & cnvrg.io
레드햇 OpenShift의 유용함은 '애플리케이션 현대화'에만 국한되지 않습니다. 레드햇 OpenShift는 AI 워크로드 처리에도 매우 유용합니다. NVIDIA DGX 시스템 소프트웨어 측면에서 볼 때 레드햇은 여러 계층에서 중요한 역할을 할 수 있습니다. 운영체제의 안정성과 보안성 등을 고려한 다면 NVIDIA DGX 시스템에 레드햇 엔터프라이즈 리눅스를 설치하면 됩니다. 여기에 컨테이너 기반 환경으로 NVIDIA DGX 시스템 자원을 더 경제적이고 효율적으로 쓰고자 할 경우 레드햇 OpenShift를 더해 쓰면 좋습니다. 그리고 MLOps까지 추구하고자 한다면 cnvrg.io를 추가하면 새로운 차원의 DGX 시스템 소프트웨어 스택이 완성됩니다.

실제로 컨테이너 플랫폼을 이용한 애플리케이션 개발, 배포, 운영에 cnvrg.io를 더하면 매우 완성도 높은 MLOps 환경이 마련됩니다. 레드햇 OpenShift만 이용하면 DevOps의 틀은 갖출 수 있습니다. MLOps를 목표로 한다면 이것만으로는 부족합니다. 데이터 파이프라인, 모델 배포, 지속적인 트레이닝, 모델 성능 모니터링 등은 DevOps 툴 체인만으로는 수용할 수 없기 때문입니다. 이 부분을 메우는 것이 바로 cnvrg.io입니다. 레드햇 OpenShift와 연계해 cnvrg.io를 쓰는 데 있어 중간 매계 역할을 하는 것이 하나 있습니다. 바로 OperatorHub입니다.
OperatorHub는 OpenShift 컨테이너 플랫폼 환경 관리를 위한 웹 콘솔입니다. MLOps를 구현하고자 한다면 레드햇 OpenShift의 OperatorHub 메뉴 중 'AI/Machine Learning' 섹션에서 cnvrg.io를 선택해 설치하면 됩니다. 사전에 통합된 형태로 제공되므로 편리하게 사용할 수 있습니다. 쿠버네티스 클러스터 관리자라면 OperatorHub를 통해 cnvrg.io를 이용하면 되고, 머신 러닝이나 딥러닝 개발자라면 Developer Catalog를 이용해 설치하면 됩니다
OperatorHub를 이용하면 사내에서 다양한 위치에 있는 쿠버네티스 클러스터와 이에 포함된 GPU 자원을 더 편리하게 관리하고 운영할 수 있습니다. 데이터 과학자나 개발자는 cnvrg.io가 제공하는 MLOps 환경을 통해 편리하게 작업을 하면 됩니다.
그렇다면 레드햇 OpenShift 플랫폼은 GPU 자원을 어떻게 관리할까요? NVIDIA GPU Operator를 이용하면 GPU 자원을 레드햇 OpenShift 클러스터에서 매우 효율적을 활용할 수 있습니다. 이를 도식으로 표현하면 다음과 같습니다.
이상으로 간단히 엔터프라이즈 컨테이너 관리 플랫폼과 MLOps 플랫폼을 연계하는 방안을 살펴보았습니다. 더 자세한 내용은 유클릭으로 문의 바랍니다.
#NVIDIA_GPU_Operator #OperatorHub #RHEL #OpenShift #레드햇_오픈시프트 #MLOps #DevOps