NVIDIA GPU

Tesla T4

Tesla T4 (Turing Architecture, 16GB GDDR6, LP지원)

  • Turing Architecture, 16GB GDDR6
  • 2560 CUDA Core / 320 Tensor Core / 40 RT Core
  • FP16:65TFlops / FP32:8.1TFlops
  • Memory Bandwidth up to 320GB/s
  • Passive

NVIDIA® T4 GPU는 고성능 컴퓨팅, 딥 러닝 트레이닝 및 추론, 머신 러닝, 데이터 분석, 그래픽 등과 같은 다양한 클라우드 워크로드를 가속화합니다.

NVIDIA Turing™ 아키텍처를 기반으로 70와트의 에너지 효율과 소형 PCI 폼팩터들로 제작된 T4는 주류의 컴퓨팅 개발 환경에 최적화되어 있으며, 다중 정밀 Turin Tensor 코어와 새로운 RT 코어가 탑재되어 있습니다.

T4는 NGC가 제공하는 가속화 컨테이너화 소프트웨어 스택과 결합하여 혁신적인 대규모 성능을 제공합니다.

  • 작은 사이즈의 폼팩터와 70W(와트)의 저전력 디자인
  • 최고 수준의 에너지 효율을 필요로 하는 데이터 센터에 적합
  • FP32, FP16, INT8에서 INT4 까지 획기적인 성능 발휘

기술 추론 개요 다운로드 추론 인포그래픽 다운로드 Turing GPU 아키텍처 백서 다운로드

획기적인 성능

T4는 다양한 워크로드에 대처하기 위한 다중 정밀도 컴퓨팅을 갖춘 혁신적인 Turing Tensor 코어 기술을 선보입니다. FP32, FP16, INT8에서 INT4 정밀도까지 획기적인 성능을 보여주는 T4는 CPU보다 최대 40배 더 높은 성능을 발휘합니다.

실시간으로 제공되는 최첨단 추론

사용자가 대화형 AI, 추천자 시스템, 시각적 검색 등의 서비스에 몰입하려면 반응성이 그 핵심입니다. 모델들의 정확도와 복잡도가 점점 커지면서 올바른 대답을 하려면 이제 기하급수적으로 커진 컴퓨팅 성능이 필요합니다.

T4는 최대 40배 빠른 처리량을 제공하므로 더 많은 요청을 실시간으로 처리할 수 있습니다.

비디오 트랜스코딩 성능

온라인 동영상의 수가 계속 기하급수적으로 증가함에 따라 동영상을 검색하고 그 안에서 인사이트를 얻기 위한 수요도 계속 성장하고 있습니다.

T4는 이전 세대 GPU보다 2배 향상된 디코딩 성능을 제공하는 전용 하드웨어 트랜스코딩 엔진을 통해 AI 동영상 애플리케이션을 위한 혁신적인 성능을 제공합니다. T4는 최대 38개의 풀 HD급 동영상 스트림을 디코드할 수 있으므로 확장 가능한 딥 러닝을 동영상 파이프라인에 통합하여 혁신적이고 스마트한 동영상 서비스를 제공할 수 있습니다.

NVIDIA TESLA T4 SPECIFICATION

GPU Architecture NVIDIA Turing
Performance TURING TENSOR 코어 : 320
NVIDIA CUDA® 코어 : 2,560
SINGLE PRECISION PERFORMANCE (FP32) : 8.1 TFLOPS
MIXED PRECISION (FP16/FP32) : 65 FP16 TFLOPS
INT8 정밀도 : 130 INT8 TOPS
INT4 정밀도 : 260 INT4 TOPS
interconnection Gen3 x16 PCIe
Memory Capacity : 16 GB GDDR6
Bandwith : 320+ GB/s
TDP 70 watts