미루웨어

AMD Instinct MI100 Accelerator (Compute Units 120 / Stream Processors 7,680 / 32GB HBM2 Memory)

>AMD Instinct MI100 Accelerator의 특징

Compute Units : 120
Stream Processors : 7,680
Peak Half Precision (FP16) Performance : 184.6 TFLOPs
Peak Single Precision (FP32) Performance : 23.1 TFLOPs
Peak Double Precision (FP64) Performance : 11.5 TFLOPs
Dedicated Memory Size : 32GB HMB2
Peak Memory Bandwidth : Up to 1228.8 GB/s
Bus Interface : PCIe Gen 3 and Gen 4 Support

AMD INSTINCT™ MI100 브로슈어 보기

Convergence of HPC and AI

Accelerate your discoveries

Why AMD Instinct™?

AMD Instinct™ 가속기는 이 새로운 컴퓨팅 시대를 위해 처음부터 설계되었으며, HPC 및 AI 워크로드를 과급하여 새로운 발견을 추진합니다.

AMD CDNA 아키텍처로 구동되는 AMD Instinct™ MI100 가속기는 AMD의 이전 세대에 비해 HPC(FP32 matrix)의 경우 거의 3.5배 향상된 성능과 AI 워크로드(FP16)의 경우 거의 7배 향상된 컴퓨팅 및 연결성을 제공합니다.

Solutions Powered by AMD Instinct™

수상 경력에 빛나는 AMD EPYC™ 프로세서 및 AMD Infinity Fabric™ 기술과 결합된 AMD Instinct™ GPU 기반 시스템은 과학자와 연구원에게 오늘 발견을 추진하고 미래의 엑사스케일에 대비하는 플랫폼을 제공합니다.

Extraordinary Under the Hood

AMD Instinct™ 제품의 중심에는 Exascale 시대에 HPC와 AI의 융합을 위한 AMD CDNA 아키텍처가 있습니다.

처음부터 이전 세대보다 거의 1.8배의 FP64 성능 효율성을 제공하도록 설계된 컴퓨팅 코어와 HPC 및 AI 성능에서 거대한 도약을 제공하는 완전히 새로운 Matrix Cores 기술로 구동되는 AMD CDNA는 컴퓨팅 발견을 새로운 차원으로 끌어 올립니다.

AMD CDNA Architecture 더 알아보기 THE AMD CDNA ARCHITECTURE 백서 보기

The era of Exascale is here.

Introducing AMD Instinct™ MI100 accelerator: First data center GPU to surpass the 10TF FP64 barrier.

HPC와 AI의 융합이 더해진 광대한 컴퓨팅 파워로 연구원들은 한 때는 해결이 불가능했던 어려운 과제들을 해결할 수 있습니다.
10TF FP64 장벽을 넘어선 최초의 데이터 센터 GPU

AMD Instinct™ MI100 가속기는 새로운 컴퓨팅 시대를 위해 철저히 제작된 세계에서 가장 빠른 HPC GPU입니다.
AMD CDNA 아키텍처 기반 MI100 가속기는 컴퓨팅 및 상호연결성 성능에서 상당한 비약을 제공해 이전 세대 AMD 가속기 대비 HPC에서 거의 3.5x의 부스트 (FP32 matrix) 및 AI에서 7x의 boost for AI (FP16) 처리율을 제공합니다.

"업계 최초의 개방형 소프트웨어 플랫폼인 AMD ROCm™이 지원하는 MI100 가속기는 고객이 AMD 솔루션에 고정되지 않는 개방형 플랫폼을 제공하여 개발자가 기존 GPU 코드를 향상시켜 어디에서나 실행할 수 있도록 합니다."

"AMD는 최고의 HPC 산업 솔루션 제공업체와 협력하여 데이터 센터를 위한 엔터프라이즈급 시스템 설계를 가능하게 합니다.
AMD EPYC™ 및 AMD Instinct™ 프로세서는 혁신적인 Infinity 아키텍처와 결합되어 기존 서버 병목 현상을 사실상 제거하여 실제 애플리케이션 배포에 최적화된 솔루션을 제공합니다."

World’s Fastest HPC GPU

"최대 11.5 TFLOP의 배정밀도(FP64) 이론상 최고 성능을 제공하는 AMD Instinct™ MI100 가속기는 HPC 애플리케이션을 위한 최고의 성능과 이전 세대 AMD 가속기에 비해 성능이 크게 향상되었습니다. MI100은 HPC 애플리케이션을 위해 최대 74% 세대 배정밀도 성능 향상을 제공합니다."

Unleash Intelligence Everywhere

"완전히 새로운 매트릭스 코어 기술로 구동되는 AMD Instinct™ MI100 가속기는 AI 애플리케이션용 이전 세대 AMD 가속기에 비해 FP16 성능이 거의 7배 향상되었습니다. MI100은 AI 및 기계 학습 워크로드를 위한 혼합 정밀도 기능과 P2P GPU 연결을 크게 확장합니다."

Technologies

AMD CDNA™ Architecture

Delivers ground-breaking technologies to fuel the convergence of HPC and AI in the era of Exascale.

AMD Infinity Architecture

With architecture, performance, and security leadership, our approach to processor design accelerates the pace of innovation so that you can break through years of data center stagnation.

AMD ROCm™ -
Open, Flexible and Portable

The AMD ROCm™ open software platform brings a rich foundation to advanced computing by seamlessly integrating the CPU and GPU with the goal of solving real-world problems.

AMD Instinct™ Technologies

• Code development
• Code validation & certification
• Benchmark validation

ROCm™ Software & Community

• Compilers, libraries & management tools
• Workload containers
• Support forums

ROCm DOCS ROCm COMMUNITY

ROCm™ Learning Center

• Support docss
• Training & tutorial resourcess
• Hackathons

Learn more

ROCm™이란 무엇입니까?

ROCm은 프로그래밍 언어에 독립적인 가속 컴퓨팅을 위한 최초의 오픈 소스 엑사스케일급 플랫폼입니다.
GPU 컴퓨팅에 선택의 철학, 미니멀리즘 및 모듈식 소프트웨어 개발을 제공합니다. 애플리케이션을 위한 도구와 언어 런타임을 자유롭게 선택하거나 개발할 수도 있습니다.

ROCm은 확장성을 위해 구축되었으며 다중 GPU 컴퓨팅을 지원하며 대규모 응용 프로그램, 컴파일러 및 언어 런타임 개발에 필요한 중요한 기능과 함께 풍부한 시스템 런타임을 제공합니다.

HPC용 ROCm 더 알아보기 머신 러닝(ML)을 위한 ROCm 더 알아보기

"Source: Oak Ridge National Laboratory: NAMD 2.14, STMV 1.06M atoms benchmark, 2x EPYC 7742 + MI100 vs 2x Power9 + V100 SXM, Cholla, Total Run measured. 2x EPYC 7742 + MI100 vs 2x EPYC 7742 + V100, PIConGPU, Total Run measured. 2x EPYC 7742 + MI100 vs 2x EPYC 7742 + V100, GESTS, Total Run measured, 2x EPYC 7742 + MI100 vs 2x EPYC 7742 + V100"
Figure 6 – AMD Instinct™ MI100 GPU powering early exascale science at Oak Ridge

SYSTEM Specification

OpenCL™
AMD Instinct™ MI100 GPU Specifications
GPU Architecture	CDNA
Compute Units	120
Peak Single Precision Matrix (FP32) Performance	46.1 TFLOPs
Peak INT4 Performance	184.6 TOPs
OS Support	Linux x86_64
Lithography	TSMC 7nm FinFET
Peak Half Precision (FP16) Performance	184.6 TFLOPs
Peak Single Precision (FP32) Performance	23.1 TFLOPs
Peak INT8 Performance	184.6 TOPs
Stream Processors	7,680
Peak Engine Clock	1502 MHz
Peak Double Precision (FP64) Performance	11.5 TFLOPs
Peak INT4 Performance	184.6 TOPs
Peak INT8 Performance	184.6 TOPs
Peak bfloat16	92.3 TFLOPs
External Power Connectors	2x PCIe® 8-pin
Total Board Power (TBP)	300W Peak
Dedicated Memory Size	32 GB
Dedicated Memory Type	HBM2
Memory Interface	4096-bit
Memory Clock	1.2 GHz
Peak Memory Bandwidth	Up to 1228.8 GB/s
Memory ECC Support	Yes (Full-Chip)
Bus Type	PCIe® 4.0 x16 / PCIe® 3.0 x16
Cooling	Passive
Infinity Fabric™ Links	3
Software API Support
OpenMP®	Yes
HIP
ROCm™ Open Ecosystem
*GPU specifications may vary by partner configuration. Please refer to partner websites for GPU specifications.

사훈	생각은 창의 행동은 성실 위기는 긍정
고객에 대한 존중	고객에게 이익이 되는 것은 회사에도 이익이 된다는 신념으로 고객을 대한다.
	항상 고객의 입장에서 생각하고, 고객의 의견을 존중하며, 고객과의 약속은 반드시 지킨다.
	제품과 서비스에 대해서는 정확한 정보만을 제공하고, 최상의 제품과 서비스를 제공함으로써 고객만족의 실현을 위해 노력한다.
법규 준수 및 공정한 경쟁	사업 및 영업 활동 시 모든 국가와 지역사회의 제반 법규를 준수하며, 해당 국가나 지역의 관습, 문화 등과 같은 사회적 가치관을 존중한다.
법규 준수 및 공정한 경쟁	경쟁사를 존중하고, 경쟁사와의 공정하고 자유로운 경쟁을 통하여 건전한 시장 질서를 확립하는 데 앞장선다.
공정한 거래	모든 거래는 공정하고 평등한 참여의 기회가 보장되는 자유경쟁 원칙에 따라 행한다.
	우월적 지위를 이용하여 여하한 형태의 비윤리적이고 부적절한 강요행위 및 영향력을 행사하지 않는다.
	모든 거래 당사자들과는 상호 신뢰를 기반으로 하여 공동 발전을 도모한다.
주주에 대한 존중	건실한 경영활동을 통한 이익을 실현함으로써 주주의 투자 수익을 보호하도록 노력한다.
	임직원은 회사에서의 지위를 이용하여 취득한 내부 정보를 활용하여 개인적인 이익을 도모해서는 안 된다.
	주주와의 상호 신뢰관계 유지를 위해서 기업 정보를 정해진 법규에 따라 투명하게 공개하며, 회계자료 등의 처리 및 보고는 해당 국가의 기준과 법규에 철저히 따른다.
국가 및 사회에 대한 책임과 의무	국가와 사회의 구성원으로서 요구되는 역할과 의무를 성실히 수행한다.
	고용의 창출과 조세의 성실한 납부로 국가 발전에 기여하고, 사회봉사 활동과 문화의 발전에 적극적으로 기여한다.
	사업 및 영업 활동 시, 환경보호를 우선적으로 생각하며, 해당 국가와 지역의 환경 기준을 철저히 준수한다.
	근무장소의 청결 및 안전수칙의 준수를 생활화하고, 사업장 내 위험요소를 발견한 경우 즉시 적절한 조치를 취한다.
	고객의 안전을 위협할 수 있는 제품 결함이 발견된 경우 신속한 조치를 취한다.
임직원에 대한 책임	임직원 개개인의 인격과 생각을 존중하고, 능력을 향상시킬 수 있는 기회를 부여함에 있어 성별, 학력, 출신, 지역 등에 따라 차별을 두지 않는다.
	임직원의 능력과 업적에 따라 공정하게 평가하고, 정당하게 보상한다.
	임직원의 독창성과 능력이 최대한 발휘될 수 있는 근무여건 조성에 전력을 다하며, 창의적인 인재 육성을 적극적으로 지원한다.
임직원의 기본 윤리	임직원은 미루인으로서 긍지와 자부심을 가지며, 항상 정직하고 성실한 생활 자세를 유지한다.
	임직원 각자가 회사를 대표한다는 자세로 항상 예의 바른 행동과 품위 있는 언어로써 미루인의 명예를 지킨다.
	공·사를 명확히 구분하며, 자신의 지위를 이용하여 사적인 이익을 추구하지 않는다.
	회사와 개인의 이해가 상충되는 경우에는 회사를 우선적으로 생각한다.
	지적 재산에 관한 타인의 권리를 존중함과 동시에 자신의 권리도 보호한다.
	회사의 영업비밀에 대해서는 재직 시 및 퇴직 후에도 회사의 사전 승인 없이 외부에 유출하지 않는다.
윤리규범의 준수	임직원은 그 지위의 고하를 막론하고 본 윤리규범을 성실히 준수해야 하며, 이를 위반한 임직원은 그에 상응하는 징계를 받을 수 있다.
윤리규범의 준수	임직원은 본 윤리규범에 위반하는 행위를 강압 받거나 인지한 경우에는 감사 조직에 알리고 상담해야 하며, 감사 조직은 임직원의 신고 및 제보에 대하여 당사자를 보호하기 위한 모든 조치를 취하여야 한다.

AMD Instinct GPU