최근 NVIDIA DGX H100에 대한 관심이 커지고 있습니다. 그도 그럴 것이 전 세대 모델인 DGX A100보다 성능이 크게 높아졌기 때문입니다. 어느 정도일까요? NVIDIA의 DGX H100은 H100 Tensor Core GPU를 장착한 4세대 제품입니다. DGX H100은 지금껏 없던 수준의 성능을 제공합니다. DGX A100과 비교할 때 컴퓨팅 성능은 6배, 네트워크 처리 속도는 2배 더 빠릅니다. 더불어 모든 세대 DGX 시스템의 강점인 하드웨어와 소프트웨어의 완벽한 통합으로 AI 전용 시스템 도입, 구축, 운영 편의성이 높습니다.
DGX SuperPOD의 DGX H100 지원 시기는?
NVIDIA DGX H100을 장착할 수 있는 DGX SupePOD 도입 가능 시기도 궁금하지 않으세요. 2022년 5월 31일 현재 DGX A100 시스템으로 구성하는 것은 유클릭을 통해 바로 지원이 가능합니다. DGX H100 시스템을 옵션으로 선택할 수 있는 시기는 2022년 연말이 될 전망입니다.
DGX A100과 DGX H100 옵션 선택은 조직의 AI 이니셔티브 전략을 고려하면 됩니다. DGX A100 기반 DGX SuperPOD은 제조, 의료, 소매, 서비스 등 다양한 산업계의 AI 워크로드 및 방대한 데이터를 기반으로 한 분석 및 예측 작업 지원에 이상적입니다. DGX H100은 초거대 모델을 기반으로 한 복잡한 AI 워크로드 처리에 더 잘 맞습니다. 아무래도 성능 차이를 무시할 수는 없습니다.
토털 서비스 제공
DGX SuperPOD은 특별한 솔루션입니다. 흔히 말하는 턴키 방식으로 도입할 수 있는 토털 솔루션입니다. 유클릭 같은 NVIDIA 인증 파트너를 통해 DGX SuperPOD 도입 검토, 설계, 구축, 운영 전반에 이르는 서비스를 단일 창구에서 받을 수 있습니다. 이를 간단히 구분해 보면 다음과 같습니다. 참고로 하드웨어의 경우 DGX A100 기준입니다.
하드웨어 및 소프트웨어
100~700 FLOPS AI 시스템
20~140 NVIDIA DGX A100 시스템
1~10PB 고성능 스토리지
200Gbps NVIDIA 네트워킹 패브릭
NVIDIA CUDA-X, DGX 소프트웨어 스택
라이프 사이클 서비스
용량 계획 수립
데이터센터 설계
성능 예측
사전 평가 및 준비
시스템 설치
시스템 테스트
프로비져닝 및 관리
교육 및 최적화
애플리케이션 성능 테스팅
문서 패키지 제공
사용자 및 DevOps 교육
NVIDIA Deep Learning Institute 교육
시스템 운영 관련 참조 자료 (Runbook)
핸드오버 세션
이상으로 DGX H100 및 DGX SuperPOD 관련 최신 소식을 정리해 보았습니다.
Comments