주소: 서울특별시 중구 퇴계로 286 쌍림빌딩 8/9층 (주)유클릭 디지털 트랜스포메이션 사업본부

전화: 02-6320-0121

© 2030 by uDNA & Uclick

NVIDIA Tesla GPU는 첨단 AI, 딥러닝 슈퍼컴퓨터의 두뇌입니다. Tesla GPU는 NVIDIA Volta 아키텍처를 기반으로 하고 있습니다. Tesla GPU의 기술전 진보는 자율 주행, 지능형 비디오 분석, 분자 시뮬레이션, 신약 개발, 질병 진단, 금융 모델링, 로봇 공학, 공장 자동화, 실시간 번역, 온라인 검색 최적화 등 다양한 분야에서 더 빠르고 효율적인 딥러닝 트레이닝 결과를 보여주고 있습니다. 

​딥러닝, HPC 환경을 위해 태어난 솔루션 

NVIDIA Telas GPU는 데이터센터에서 이루어지는 각종 AI 프로젝트의 핵심 요소로 모델 개발과 트레이닝 속도를 극대화합니다. 과거 CPU 기반 클러스터와 비교할 수 없을 정도의 빠른 속도와 성능을 제공합니다. 더 많은 데이터 세트, 더 정교한 모델, 더 복잡한 시뮬레이션 워크로드가 요구하는 특성이 무엇이건 관계없습니다. NVIDIA Telas GPU 기반 데이터센터 인프라를 구축하면 NVIDIA Jetson, Drive PX2 등이 장착된 자율 주행 자동차, 사물인터넷 관련 각종 임베디드 장치를 연계해 실시간 인퍼런스(Inference) 체계를 매끄럽게 마련할 수 있습니다. 

M60, M6 Card 

NVIDIA Tesla GPU 중 M60, M6 카드는 엔터프라이즈에서 사용하는 서버용 모델입니다. M60은 랙 타입 서버에 탑재되고, M6는 블레이드 서버에 장착됩니다. M60은 4,096개의 CUDA 코어를 제공하며, 16GB의 GDDR5 메모리가 제공됩니다. M6는 1,536 CUDA 코어, 8GB GDDR5 메모리를 주요 사양으로 합니다. 

K40, K80

NVIDIA Tesla GPU 중 K80, K40 카드는 고성능 병렬 처리를 위한 카드로 각각 4,992/2,880 CUDA 코어를 제공합니다. 

P100

NVIDIA Tesla GPU 중 P100 카드는 딥러닝을 위한 제품으로 Mazzanine과 PCI-Express 모델로 구분되며 3,584개의 CUDA 코어를 제공합니다. 

M40, M4 

NVIDIA Tesla GPU 중 M40, M4 카드는 머신 러닝에 특화된 카드로 각각 3,072/1,024 CUDA 코어를 제공합니다. 

P40, P4 

NVIDIA Tesla GPU 중 P40, P4 카드는 인퍼런스(Infernece)에 특화된 카드로 각각 3,584/1,024 CUDA 코어를 제공합니다. 

T4

NVIDIA Tesla GPU 중 T4는 차세대 인퍼런스 가속을 위해 특별히 개발되었습니다. NVIDIA Turing Tensor Core를 기반으로 AI 인퍼런스 속도를 CPU 대비 40배 이상 빠른 속도로 가속합니다. 

NVIDIA Tesla GPU는 Volta 아키텍처를 채용했습니다. 이 아키텍처는 트레이닝, 인퍼런스 모든 측면에서 이전 세대 GPU 아키텍처를 크게 웃도는 성능을 보여줍니다. 

Volta
아키텍처의
주요 특징
딥 러닝에 최적화된 새로운 스트리밍 멀티프로세서(Streaming Multiprocessor, SM) 아키텍처

Volta는 GPU의 중심에 있는 SM 프로세서 아키텍처의 재설계가 중요한 특징입니다. 새로운 Volta SM은 이전 세대인 Pascal 설계보다 에너지 효율성이 50% 더 우수하며 동일한 전력에서 FP32 및 FP64 성능을 상당히 향상시킵니다. 딥 러닝을 위해 특별히 설계된 새로운 텐서 코어는 트레이닝에서 최대 12배 높은 피크 TFLOPS를, 추론에서 6배 높은 피크 TFLOPS를 제공합니다. 독립적인 병렬의 정수와 부동 소수점 데이터 경로를 포함한 Volta SM은 연산과 주소 계산의 혼합으로 워크로드에 훨씬 더 효율적입니다. Volta의 새로운 독립적 스레드 일정 관리 기능은 미세 동기화와 병렬 스레드 간 협력을 지원합니다. 마지막으로, 새로운 결합형 L1 데이터 캐시와 공유 메모리 유닛은 프로그래밍을 단순화하는 동시에 성능을 크게 개선합니다.

2세대 NVIDIA NVLink

2세대 NVIDIA NVLink의 고속 인터커넥트는 다중 GPU와 다중 GPU/CPU 시스템 구성을 위해 더 높은 대역폭, 추가 링크, 개선된 확장성을 제공합니다. GP100이 NVLink 링크 4개와 160GB/sec의 총 대역폭을 지원하는 것에 비해, Volta GV100은 최대 6개의 NVLink 링크와 300GB/sec의 총 대역폭을 지원합니다. NVLink는 이제 IBM Power 9 CPU 기반 서버로 CPU 마스터링과 캐시 일관성을 지원합니다. V100 AI 슈퍼컴퓨터의 새로운 NVIDIA DGX-1은 초고속 딥 러닝 트레이닝에 탁월한 확장성을 제공하기 위해 NVLink를 사용합니다.

HBM2 메모리: 더 빠르고 더 높은 효율성

Volta의 고도로 조정된 16GB HBM2 메모리 서브 시스템은 900GB/sec 피크 메모리 대역폭을 제공합니다. 삼성의 신세대 HBM2 메모리와 Volta의 신세대 메모리 컨트롤러의 조합이 여러 워크로드를 작동시키는 최대 95%의 메모리 대역폭 활용을 통해 Pascal GP100에 비해 1.5배의 메모리 대역폭을 제공합니다.

Volta 멀티 프로세스 서비스

Volta 멀티 프로세스 서비스(MPS)는 GPU를 공유하는 여러 개의 컴퓨팅 애플리케이션에 성능 개선, 분리, 우수한 서비스 품질(QoS)을 지원하면서 CUDA MPS 서버의 중대한 구성요소의 하드웨어 가속화를 제공하는 Volta GV100 아키텍처의 새로운 특징입니다. Volta MPS는 또한 Pascal에서는 16개였던 MPS 클라이언트의 최대 개수를 Volta에서는 48개로 3배 증가됐습니다 .

통합 메모리와 주소 변환 서비스 강화

GV100 통합 메모리 기술은 메모리 페이지를 가장 자주 액세스하는 프로세서로, 더 정확하게 마이그레이션할 수 있는 새로운 접근 계수기를 포함하고 있어서 프로세서 간 공유되는 메모리 범위의 효율성을 개선합니다. IBM Power 플랫폼은 새로운 주소 변환 서비스(ATS)를 지원함으로써 GPU가 CPU의 페이지 테이블에 직접 액세스할 수 있습니다.

최대 성능 및 최대 효율성 모드

최대 성능 모드에서, Tesla V100 가속기는 가장 빠른 연산 속도와 최고의 데이터 처리량이 필요한 애플리케이션을 가속하기 위해 300W의 TDP(Thermal Design Power) 수준까지 작동합니다. 최대 효율성 모드는 데이터 센터 관리자가 Tesla V100 가속기를 최적의 와트당 성능으로 작동시키기 위해 전력 사용을 조정할 수 있습니다. 랙에 있는 모든 GPU에 대해 최대 전력 사용량을 제한하여 뛰어난 랙 성능을 활용하면서도 전력 소비를 크게 줄일 수 있습니다.

Cooperative Groups와
새로운 Cooperative Launch API

Cooperative Groups는 스레드 그룹을 구조화하기 위해 CUDA 9에 도입된 새로운 프로그래밍 모델입니다. 개발자들은 Cooperative Groups를 이용해서 스레드 간에 상태 정보를 알 수 있어 더 풍부하고 효율적인 병렬 분해를 할 수 있습니다. 기본적인 Cooperative Groups 기능은 Kepler 이후 모든 NVIDIA GPU에서 지원됩니다. Pascal과 Volta는 CUDA 스레드 블록 간의 동기화를 지원하는 새로운 Cooperative Launch API에 대한 지원을 포함하고 있습니다. Volta는 새로운 동기화 패턴 지원을 추가했습니다.

Volta 최적화 소프트웨어

Caffe2, MXNet, CNTK, TensorFlow 등 새로운 버전의 딥 러닝 프레임워크는 훨씬 더 빠른 트레이닝 시간과 더 높은 다중 노드 트레이닝 성능을 제공하기 위해 Volta의 성능을 활용합니다. cuDNN, cuBLAS,TensorRT 같은 GPU 가속 라이브러리의 Volta 최적화 버전은 딥 러닝 추론과 HPC(High Performance Computing) 애플리케이션에 뛰어난 성능을 제공하기 위해 Volta GV100 아키텍처의 새로운 기능을 활용합니다. NVIDIA CUDA Toolkit 9.0 버전은 새로운 API 및 Volta 기능을 지원하여 더욱 간편한 프로그램 용이성을 제공합니다.

  • 블랙 블로거 아이콘