top of page

NVIDIA AI Enterprise 3.0의 새로운 기능

NVIDIA AI Enterprise 3.0이 새로운 기능과 함께 발표되었습니다. NVIDIA AI Enterprise는 기업에서 AI를 구현하고 실행하기 위한 완전한 솔루션 스택입니다. NVIDIA AI Enterprise의 주요 특징은 다음과 같습니다.


  • 최신 기술: NVIDIA의 최신 GPU 및 소프트웨어 스택을 통해 빠른 처리 속도와 더 높은 효율성을 확보할 수 있습다.

  • 확장성: 기업은 NVIDIA의 GPU 기술을 사용하여 AI 모델을 확장하고, 더 많은 데이터를 처리하고, 더 많은 문제를 해결할 수 있습니다.

  • 개발 생산성: 다양한 도구와 라이브러리를 활용해 개발자는 더 쉽게 AI 모델을 구현하고, 더욱 빠르게 개발할 수 있습니다.

  • 통찰력: 기업은 AI 모델을 사용하여 대용량 데이터를 분석하고, 복잡한 패턴을 탐지하여 더 빠르게 의사 결정을 내릴 수 있습니다.

  • 안정성: NVIDIA의 최신 AI 기술은 고성능과 안정성을 결합하여 더 높은 신뢰성을 제공합니다.

  • 보안: NVIDIA의 보안 솔루션은 데이터 및 AI 모델을 안전하게 보호하며, 데이터 누출과 같은 보안 문제를 방지합니다.

  • 유연성: 기업은 자신의 데이터센터 또는 클라우드에서 NVIDIA AI Enterprise를 구현할 수 있어 하이브리드 멀티 클라우드 기반으로 AI 인프라와 플랫폼을 운영할 수 있습니다.


3.0 버전에서 주목할 신기능은?

NVIDIA AI Enterprise 3.0에서 주목할 신기능을 몇 가지 추려 보겠습니다. 첫 번째는 NGC 카탈로그 지원입니다. 이제 NGC 칼탈로그에 게시된 모든 NVIDIA AI 소프트웨어를 NVIDIA AI Enterprise 3.0 환경에서 활용할 수 있습니다. 따라서 NVIDIA AI Enterprise를 구독하고 있는 조직의 데이터 과학자나 AI 개발자는 50개 이상의 AI 프레임워크, 사전 훈련된 모델 및 SDK에 대한 NVIDIA 엔터프라이즈 지원 혜택을 누릴 수 있습니다


두 번째는 성능입니다. 3.0 버전에는 인프라 성능 최적화를 돕는 기능이 추가되었습니다. 여기에는 GPUDirect 스토리지, VMWare vSphsere 8.0의 GPU 가상화, 다중 vGPU 지원 등이 포함됩니다. 각각 알아보자면 먼저 이번 버전부터 매그넘 IO GPUDirect 스토리지가 지원되어 NVIDIA AI Enterprise 환경에서 데이터 처리 성능을 개선할 수 있게 되었습니다. 참고로 GPUDirect 스토리지는 CPU 처리 없이 GPU에서 데이터를 소비하거나 생성하는 애플리케이션을 위해 스토리지와 GPU 버퍼 간의 데이터 흐름을 간소화합니다. RDMA를 사용하여 스토리지에서 GPU 메모리로의 직접 경로에서 데이터를 빠르게 이동하고 바운스 버퍼를 통해 추가 복사를 제거하여 대기 시간을 줄이고 CPU 부담을 줄입니다. 더 자세한 내용은 NVIDIA AI Enterprise 환경에서 GPUDirect 스토리지를 실행하는 방법을 소개하는 문서를 참조 바랍니다.


VMWare vSphsere 8.0의 GPU 가상화 지원도 반가운 소식입니다. 이제 하나의 VM에 최대 8개의 vGPU를 추가하여 이전 릴리스와 비교해 vGPU 수를 두 배로 늘릴 수 있습니다. 이에 따라 대규모 머신 러닝 모델의 성능 개선 및 복잡한 AI 및 머신 러닝 워크로드 처리에 있어 더 높은 확장성을 NVIDIA AI Enterprise 환경에서 확보할 수 있게 되었습니다. 가상화 관련해 VMWare 외에도 3.0 버전은 Red Hat Enterprise Linux 8.4, 8.6, 8.7, 9.0 및 9.1의 가상화 지원을 강화하였습니다. 이에따라 이제 NVIDIA AI Enterprise 환경에서 KVM 환경에 AI 워크로드를 자유롭게 배포할 수 있습니다.


다음으로 3.0 버전을 사용하면 단일 VM에 여러 vGPU를 프로비져닝 할 수 있습니다. 이전 버전의 경우 VM에 단일 GPU 또는 여러 GPU를 할당하는 방식이었는데, 3.0의 경우 다중 vGPU를 단일 VM에 프로비져닝 할 수 있어 자원 활용의 유연성이 높아졌습니다.



소개한 기능 외에도 3.0 버전은 A100 GPU, MIG, 사전 훈련(Pre-trained) 모델, 최신 딥 러닝 프레임워크, 쿠버네티스 지원, GPU 인스턴스 스케일링 등 여러 면에서 개선이 이루어졌습니다. 더 자세한 내용을 릴리즈 노트를 참고 바랍니다.


조회수 121회댓글 0개

Comments


bottom of page