NVIDIA GPU

NVIDIA A40

NVIDIA A40 (Ampere GPU / 10,752 CUDA Cores / 48GB GDDR6 Memory with ECC)

  • Ampere GPU / 10,752 NVIDIA CUDA Cores
  • 336 NVIDIA Tensor Cores / 84 NVIDIA RT Cores
  • 48GB GDDR6 Memory with ECC
  • Up to 768GB/s Memory Bandwidth
  • Max. Power Consumption: 300W
  • Graphics Bus: PCI-E 4.0 x16 / Thermal Solution: Passive
  • Support Quadro vDWS / Display Connectors: DP 1.4 (4)
  • NVLink: 2-way low profile (2-slot)
NVIDIA A40 Datasheet 다운로드

NVIDIA Ampeere GPU Architecture가 제공하는 빠른 인터랙티브 성능– 초고속 온보드 그래픽 메모리 기술과 전문 애플리케이션에 최적화된 소프트웨어 드라이버 2세대 RT 코어로 이전 세대보다 최대 2배 빠른 사실적 레이트레이싱 렌더링 속도 향상

3세대 텐서 코어(Tensor Core)로 AI 워크로드 가속화 – DLSS, AI 디노이즈, 선택한 애플리케이션에 대한 편집 기능 강화 등의 기능으로 그래픽에 AI 기능 제공

원격 사용자를 위해 보다 크고 강력한 가상 워크스테이션 인스턴스를 지원하여 Quadro vDWS 또는 AI를 통해 하이엔드 설계를 위한 대규모 워크플로우를 지원하고 NVIDIA vCS를 통해 컴퓨팅 지원

NVIDIA Ampere 아키텍처 CUDA® 코어

단정밀도 부동 소수점(FP32) 연산 및 향상된 전력 효율성을 위한 2배 속도 처리는 데스크톱에서 복잡한 3D CAD(Computer-Aided Design) 및 CAE(Computer-Aided Engineering)와 같은 그래픽 및 시뮬레이션 워크플로우 성능을 크게 향상시킵니다.

2 세대 RT 코어

이전 세대에 비해 최대 2 배의 처리량과 셰이딩 또는 노이즈 제거 기능을 사용하여 레이 트레이싱을 동시에 실행할 수있는 기능을 갖춘 2 세대 RT 코어는 영화 콘텐츠의 사실적 렌더링, 아키텍처 디자인 평가 및 가상 프로토 타이핑과 같은 워크로드에 대해 엄청난 속도 향상을 제공합니다.

제품 디자인. 이 기술은 또한 레이트 레이싱 된 모션 블러의 렌더링 속도를 높여 시각적 정확도를 높여 더 빠른 결과를 제공합니다.

3세대 Tensor 코어

새로운 Tensor Float 32(TF32) 정밀도는 이전 세대에 비해 5배의 트레이닝 처리량을 제공하여 코드를 변경하지 않아도 AI 및 데이터 사이언스 모델 트레이닝을 가속화합니다. 구조적 희소성에 대한 하드웨어 지원은 추론을 위한 처리량을 두 배로 높입니다. Tensor 코어는 또한 DLSS, AI 노이즈 제거 및 일부 애플리케이션에 대한 향상된 편집 기능과 같은 기능을 통해 그래픽에도 AI를 지원합니다.

3세대 NVIDIA NVLink®

GPU 간 인터커넥트 대역폭이 증가되어 그래픽 및 컴퓨팅 워크로드를 가속화하고 보다 규모가 큰 데이터 세트를 처리하는 하나의 확장 가능 메모리를 제공합니다.

고속 GDDR6 48GB의 GPU 메모리

NVLink를 통해 최대 96GB로 확장 가능한 초고속 GDDR6 메모리는 데이터 사이언티스트, 엔지니어 및 크리에이티브 전문가에게 데이터 사이언스 및 시뮬레이션과 같은 대규모 데이터 세트 및 워크로드로 작업하는 데 필요한 대용량 메모리를 제공합니다.

가상화 지원

NVIDIA 가상 GPU(vGPU) 소프트웨어를 통한 차세대 개선 기능으로 원격 사용자를 위한 보다 대규모의 더욱 강력한 가상 워크스테이션 인스턴스가 가능하여 하이엔드 디자인, AI 및 컴퓨팅 워크로드를 위한 대규모 워크플로우가 지원됩니다.

PCI Express Gen 4

PCI Express Gen 4는 PCIe Gen 3의 대역폭을 2배로 증가시켜 AI 및 데이터 사이언스와 같은 데이터 집약적인 작업을 위한 CPU 메모리의 데이터 전송 속도를 개선합니다.

AI에 최적화 된 소프트웨어

Caffe2, MXNet, CNTK, TensorFlow 등과 같은 딥 러닝 프레임 워크는 훨씬 더 빠른 훈련 시간과 더 높은 다중 노드 훈련 성능을 제공합니다. cuDNN, cuBLAS 및 TensorRT와 같은 GPU 가속 라이브러리는 딥 러닝 추론 및 HPC (고성능 컴퓨팅) 애플리케이션 모두에 더 높은 성능을 제공합니다.

NVIDIA 가상 GPU 소프트웨어

NVIDIA 가상 GPU (vGPU) 소프트웨어 지원을 통해 개인용 워크 스테이션을 여러 고성능 가상 워크 스테이션 인스턴스로 용도 변경하여 원격 사용자가 리소스를 공유하여 고급 설계, AI 및 컴퓨팅 워크로드를 구동 할 수 있습니다.

NVIDIA ® CUDA ® 병렬 컴퓨팅 플랫폼

C / C ++ 및 Fortran과 같은 표준 프로그래밍 언어와 OpenCL, OpenACC 및 Direct Compute와 같은 API를 기본적으로 실행하여 광선 추적, 비디오 및 이미지 처리, 계산 유체 역학과 같은 기술을 가속화합니다.

NVIDIA A40 SPECIFICATION

  GPU Features
GPU Architecture  Ampere architecture-based GPU
CUDA Parallel Processing cores 10,752
NVIDIA Tensor Cores 336
NVIDIA RT Cores 84
Frame Buffer Memory 48 GB GDDR6  48GB(ECC 포함)
Memory Bandwidth 768 GB/s
vGPU Software Support NVIDIA® GRID® , NVIDIA Quadro® Virtual Data Center Workstation, NVIDIA Virtual Compute Server*
System interface PCI Express 4.0 x16
Power consumption Total board power: 300 W
Thermal solution Passive
Display connectors DP 1.4 (3) **
vGPU profiles supported 1 GB, 2 GB, 3 GB, 4 GB, 6 GB, 8 GB, 12 GB, 16 GB, 24 GB, 48 GB 
Frame lock Compatible (with Quadro Sync II)
NVLink 2-way low profile (2-slot)
NVLink Interconnect 112.5 GB/s (bidirectional)
Form Factor 4.4” H x 10.5” L Dual Slot
Power connector 1x 8-pin CPU