AI 인프라 최적화는 오랜 현장 경험을 바탕으로 중앙집중적인 관리 체계 수립에 필요한 소프트웨어 스택에 대한 포괄적인 지식이 있어야 최적의 상태로 구축해 운영할 수 있습니다. 유클릭은 컴퓨트, 스토리지, 네트워크 인프라 최적화와 중잉집중적인 관리 체제 정립을 통해 기업이 AI 인프라 투자 효과를 극대화하는 한편 운영을 간소화할 수 있도록 돕습니다. 더불어 전사 측면에서 사용하는 모든 GPU 자원을 데이터 과학자, AI 개발자가 더 효율적이고, 생산적으로 사용할 수 있도록 하는 AI as a Service 환경에서 AI 프로젝트 추진의 속도를 높여 더 빨리 비즈니스 성과를 거둘 수 있습니다. 

AI Datacenter

기업의 데이터센터 환경에서 GPU의 비중이 매우 커지고 있습니다. GPU는 CPU와 함께 첨단 데이터센터에서 AI부터 시작해 빅 데이터 처리까지 매우 중요한 워크로드를 담당하는 중추입니다. 많은 기업이 미래 데이터센터 전략에 GPU 기반 인프라를 반영하기 위해 컴퓨트 노드, 네트워크, 스토리지 그리고 운영까지 모든 측면에서 혁신을 준비 중입니다. 

​출처: NVIDIA

NVIDIA DGX SuperPOD는 사전에 최적화된 형태로 공급하는 데이터센터입니다. NVIDIA DGX SuperPOD의 성능은 전통적인 방식으로 수백 대 이상의 서버를 투입해 구성한 대규모 클러스터를 웃돕니다. 기업은 현재 운영 중인 데이터센터 환경과 설비를 늘리지 않고 곧바로 NVIDIA DGX SuperPOD를 배치할 수 있습니다. 

DGX SuperPOD는 최대 140대의 DGX A100으로 구축할 수 있습니다. 맬라녹스 네트워킹 스위치와 DGX POD 인증 스토리지로 하드웨어가 구성되어 대규모 클러스터도 강력한 성능을 제공합니다.

​DeepOps를 이용한 중앙집중적인 관리

NVIDIA DGX SuperPOD는 랙의 수가 얼마가 되던 마치 1대의 서버를 관리하는 듯한 편의성을 제공합니다. 컴퓨트, 스토리지, 네트워크 장치는 하나의 거대한 가상 자원 풀로 묶입니다. 관리자와 사용자는 컨테이너 기반 환경을 통해 원하는 소프트웨어 스택으로 구성한 AI 워크로드를 운영할 수 있습니다. 관리자는 Grafana 등의 도구를 사용해 인프라 전반에 대한 운영 상황을 풍부한 시각화 기반으로 파악할 수 있습니다. 

NVIDIA DGX SuperPOD는 배포 위치에 관계 없이 통합해 관리할 수 있습니다. 지리적으로 분산해 데이터센터를 운영하거나, 여러 곳에 연구소를 두고 현지에 NVIDIA DGX SuperPOD를 사용할 경우 WAN을 통해 관리를 통합할 수 있습니다. 실제로 DGX SuperPOD 환경은 규모에 관계없이 자원 인프라 자원 배포와 관리도 쉽습니다. DeepOps DGX POD 관리 소프트웨어를 이용하면 Kubernetes, Slure 등을 이용해 인프라와 자원을 효율을 효율적으로 관리할 수 있습니다.  그리고 NVIDIA GPU CLOUD(NGC)와 연계가 가능해 AI 관련 소프트웨어, 도구, 라이브러리 등의 활용이 매우 간편합니다. 참고로 NGC에서 제공하는 컨테이너 이미지를 이용하면 DeepOps 기반의 컨테이너 환경을 더 간편하게 이용할 수 있습니다. 필요한 이미지를 가져와 바로 올려 실행하면 됩니다. 

DGX SuperPOD에 최적화된 NVIDIA AI 소프트웨어는 사용자가 일일이 설치하고, 안정화 여부를 확인해야 할 필요가 없는 수준으로 사전에 최적화된 형태로 제공됩니다. DGX SuperPOD에서 운영하는 애플리케이션 성능 최적화 역시 크게 신경 쓸 것이 크게 없습니다. NVIDIA는 성능 최적화를 위한 다양한 라이브러리, 도구, 기술을 한데 묶어 제공하는 CUDA-X를 통해 시각화, 딥러닝, 분석, 시뮬레이션 등 다양한 분야의 애플리케이션 성능을 극한으로 끌어올립니다. 더불어 GPUDirect 기술에 기반한 Magnum IO 소프트웨어를 통해 고속 인터페이스 기술의 이점을 통해 네트워킹 병목을 최소화하여 성능을 보장합니다. 

RAPIDS는 모델 트레이닝 가속 플랫폼입니다. 이를 이용하면 데이터 과학자와 AI 개발자는 데이터 준비, 트레이닝, 시각화 등 AI 프로젝트 관련 End-to-End 가속 효과를 누릴 수 있습니다. 실제 적용을 하면 며칠 걸리던 트레이닝을 몇 시간 수준으로 가속할 수 있습니다. 

CUDA-X는 CUDA 환경에서 더 빠른 가속을 수행할 수 있도록 돕는 플랫폼입니다. 40여개 이상의 가속 라이브러리를 통해 GPU 가속을 극대화하여 딥러닝, 머신 러닝, 데이터 분석 속도를 높여 더 적은 하드웨어 자원으로 더 많은 결과를 얻을 수 있도록 합니다. 

Nvidia GPU Cloud(NGC)는 데이터 과학자와 AI 애플리케이션 개발자를 위한 소프트웨어 허브입니다. 이를 활용하면 모델 개발, 트레이닝, 인퍼런싱, 애플리케이션 개발에 필요한 소프트웨어를 아주 편리하게 쓸 수 있습니다. 

주소: 서울특별시 중구 퇴계로 286 쌍림빌딩 8/9층 (주)유클릭 AI 사업본부

전화: 02-6320-0121

© 2030 by uDNA & Uclick

  • 블랙 블로거 아이콘