주소: 서울특별시 중구 퇴계로 286 쌍림빌딩 8/9층 (주)유클릭 디지털 트랜스포메이션 사업본부

전화: 02-6320-0121

© 2030 by uDNA & Uclick

AI 인프라 최적화는 오랜 현장 경험을 바탕으로 중앙집중적인 관리 체계 수립에 필요한 소프트웨어 스택에 대한 포괄적인 지식이 있어야 최적의 상태로 구축해 운영할 수 있습니다. 유클릭은 컴퓨트, 스토리지, 네트워크 인프라 최적화와 중잉집중적인 관리 체제 정립을 통해 기업이 AI 인프라 투자 효과를 극대화하는 한편 운영을 간소화할 수 있도록 돕습니다. 더불어 전사 측면에서 사용하는 모든 GPU 자원을 데이터 과학자, AI 개발자가 더 효율적이고, 생산적으로 사용할 수 있도록 하여 AI 프로젝트 추진의 속도를 높여 더 빨리 비즈니스 성과를 거둘 수 있습니다. 

AI Datacenter

기업의 데이터센터 환경에서 GPU의 비중이 매우 커지고 있습니다. GPU는 CPU와 함께 첨단 데이터센터에서 AI부터 시작해 빅 데이터 처리까지 매우 중요한 워크로드를 담당하는 중추입니다. 많은 기업이 미래 데이터센터 전략에 GPU 기반 인프라를 반영하기 위해 컴퓨트 노드, 네트워크, 스토리지 그리고 운영까지 모든 측면에서 혁신을 준비 중입니다. 

NVIDIA DGX POD는 사전에 최적화된 형태로 공급하는 데이터센터입니다. NVIDIA DGX POD의 성능은 전통적인 방식으로 수백 대 이상의 서버를 투입해 구성한 대규모 클러스터를 웃돕니다. 기업은 현재 운영 중인 데이터센터 환경과 설비를 늘리지 않고 곧바로 NVIDIA DGX POD를 배치할 수 있습니다. 

NVIDIA DGX POD 랙 하나에는 9대의 DGX-1 서버, 12대의 스토리지 서버, 3개의 네트워크 스위치가 장착됩니다. 랙당 소비전력이 35Kw에 불과해 AI 워크로드 증가에 따라 인프라를 확장해도 전력, 상면, 공조 관련 걱정이 없습니다. 또한, 42U 표준 랙을 사용해 추가  작업 없이 바로 설치할 수 있습니다. 

​중앙집중적인 관리

NVIDIA DGX POD는 랙의 수가 얼마가 되던 마치 1대의 서버를 관리하는 듯한 편의성을 제공합니다. 컴퓨트, 스토리지, 네트워크 장치는 하나의 거대한 가상 자원 풀로 묶입니다. 관리자와 사용자는 컨테이너 기반 환경을 통해 원하는 소프트웨어 스택으로 구성한 AI 워크로드를 운영할 수 있습니다. 관리자는 Grafana 등의 도구를 사용해 인프라 전반에 대한 운영 상황을 풍부한 시각화 기반으로 파악할 수 있습니다. 

NVIDIA DGX POD는 배포 위치에 관계 없이 통합해 관리할 수 있습니다. 지리적으로 분산해 데이터센터를 운영하거나, 여러 곳에 연구소를 두고 현지에 NVIDIA DGX POD를 사용할 경우 WAN을 통해 관리를 통합할 수 있습니다. 

DGX POD에 최적화된 NVIDIA AI 소프트웨어는 사용자가 일일이 설치하고, 안정화 여부를 확인해야 할 필요가 없는 수준으로 사전에 최적화된 형태로 제공됩니다. 제공되는 소프트웨어는 각종 라이브러리, 프레임워크, 클러스터 관리 도구 등 다양합니다. 

RAPIDS는 모델 트레이닝 가속 플랫폼입니다. 이를 이용하면 데이터 과학자와 AI 개발자는 데이터 준비, 트레이닝, 시각화 등 AI 프로젝트 관련 End-to-End 가속 효과를 누릴 수 있습니다. 실제 적용을 하면 며칠 걸리던 트레이닝을 몇 시간 수준으로 가속할 수 있습니다. 

CUDA-X는 CUDA 환경에서 더 빠른 가속을 수행할 수 있도록 돕는 플랫폼입니다. 40여개 이상의 가속 라이브러리를 통해 GPU 가속을 극대화하여 딥러닝, 머신 러닝, 데이터 분석 속도를 높여 더 적은 하드웨어 자원으로 더 많은 결과를 얻을 수 있도록 합니다. 

Nvidia GPU Cloud(NGC)는 데이터 과학자와 AI 애플리케이션 개발자를 위한 소프트웨어 허브입니다. 이를 활용하면 모델 개발, 트레이닝, 인퍼런싱, 애플리케이션 개발에 필요한 소프트웨어를 아주 편리하게 쓸 수 있습니다. 

GPU 자원 관리

(주)유클릭은 GPU 기반의 AI 인프라를 더 효율적이고, 경제적으로 활용하고 운영할 수 있도록 돕기 위해 컨테이너 환경 관리 및 GPU 가상화, GPU 잡 스케줄러 등의 솔루션을 제공합니다. 이를 통해 인프라 구축, AI 소프트웨어 구성, 자원 최적화까지 End-to-End 서비스를 제공합니다. 

  • 블랙 블로거 아이콘