IBM GPU Server

Beser Srvr for

IBM Power9 Newell IC922

IBM Power9 Newell IC922

NVMe 가속화된 멀티클라우드 사용 플래시 어레이

IBM Power System IC922 추론 서버는 AI 모델을 작동시키고 비즈니스 인사이트를 얻을 수 있도록 제작되었습니다.

이는 최적화된 하드웨어와 소프트웨어를 사용하여 데이터에서 인사이트를 이끌어 낼 AI 추론의 필수 컴포넌트를 제공합니다.
대용량 내장 스토리지와 높은 대역폭을 지원하는 2U 서버 – 최대 24개 NVMe 또는 SAS/SATA 지원

  • 인텔 대비 코어 당 쓰레드 수 2배
  • 고성능 스토리지/네트워크를 PCIe Gen4 기술로 처리량 2배
  • POWER9 기반의 Power IC922는 데이터 처리량 향상 및 대기 시간 감소를 지원하기 위해 고급 상호연결(PCIe 4세대, OpenCAPI)을 제공합니다.

    가속화된 Power IC922서버는 최대 6개의 NVIDIA® Tesla T4 GPU를 지원합니다.

    IBM Power9 Newell IC922

    데이터, 트레이닝 및 추론이란 무엇일까요?

    데이터, 트레이닝 및 추론 솔루션은 하드웨어 및 소프트웨어를 결합하여 AI 워크로드 처리에 필수적인 IT 시스템을 구축합니다.

    데이터, 트레이닝 및 추론
    데이터 솔루션
    • 대규모 데이터 워크로드에 중점을 둠
    • 우수한 데이터 처리량 및 스토리지 용량 제공
    • 데이터 레이크 문제 해결
    • AI를 위한 데이터 준비
    트레이닝 솔루션
    • AI 모델 구축, 트레이닝 및 재트레이닝
    • AI로 인사이트 확보 시간 단축
    • 데이터 및 연산 집중형 인프라 제공
    • 기존 데이터로부터 새로운 기능 학습
    추론 솔루션
    • 트레이닝된 모델을 기반으로 새로운 정보를 수집하고 인사이트를 추론
    • 트레이닝에서 새 데이터로 학습 기능 적용
    • AI를 프로덕션에 배치
    • 트레이닝보다 데이터 수집에 더 가깝게 배치

    IBM Power IC922의 주요 기능

    가속화된 컴퓨팅
    가속화된 Power IC922는 최대 8개의 NVIDIA T4 GPU를 지원합니다.

    고급 I/O 상호연결
    Power IC922는 데이터 처리량 향상 및 대기 시간 감소를 지원하기 위해 고급 상호연결(PCIe 4세대, OpenCAPI)을 제공합니다. PCIe 4세대는 x86 서버에 있는 PCIe 3세대 상호연결의 데이터 대역폭보다 2배 더 넓은 대역폭을 제공합니다.

    최적화된 AI 소프트웨어
    Power IC922 추론 서버는 Power AC922 및 Power IC922 전체에서 POWER9용으로 설계된 동일한 AI 소프트웨어(PowerAI 버전)를 사용합니다.

    풍부한 스토리지 디자인
    스토리지가 풍부한 Power IC922는 소켓당 170GB/초의 최대 메모리 대역폭을 제공하며, 2U 시스템에서 최대 24개의 SAS/SATA 드라이브와 결합됩니다.

    모듈식 및 확장 가능
    Power IC922는 확장 가능하도록 설계되었으므로, 온프레미스 환경인지 또는 프라이빗 클라우드 환경인지에 관계없이 모두 엔터프라이즈급 지원을 제공하면서 비즈니스 요구를 충족하기 위해 인프라를 스케일링할 수 있습니다.

    빠른 인사이트
    훈련된 AI 모델을 사용하여 새로운 비즈니스 데이터를 AI 인사이트로 빠르게 전환합니다.
    미래 대비
    특별하게 구축된 추론 인프라를 활용하여 비즈니스 요구에 따라 스케일링할 수 있습니다.
    최적화된 AI 소프트웨어
    훈련 및 추론 서버 전체에서 POWER9 하드웨어용으로 설계된 AI 소프트웨어를 사용합니다.
    엔터프라이즈 보안
    IBM Power System IC922에는 하드웨어 및 소프트웨어 스택에 보안 기능이 구축되어 있습니다.

    SYSTEM Specification

    Power9 Processor
    - 2개의 POWER9 칩 및 SMT4 지원 – 12, 16, 20 코어 옵션
    - 12 Core (160W) – 2.8 ~ 3.8GHz (Torbo)
    - 16 Core (225W) – 3.35 ~ 4.0 GHz (Torbo)
    - 20 Core (225W) – 2.9 ~ 3.8GHz (Torbo)
    2U에 최대 160 쓰레드 지원 - 인텔 대비 코어당 쓰레드 수 2배

    Memory
    - Direct Attach Memory
    - 32 DDR4 ISDIMM Slots @2400 MHz (double drop)
    - 16 DDR4 ISDIMMs @2667 MHz (single drop)
    - 16, 32, 64 GB RDIMMs
    - 2 TB Max memory
    - 340 GB/s peak memory BW (with 16x DIMMs)

    10 Integrated I/O Slots – Standard PCIe Riser
    - 2 PCIe G3 x16 FHFL Slots (Supports double-wide accelerator)
    - 2 PCIe G4 x16 LP Slots
    - 2 PCIe G3 x8 FHFL Slots (physically x16)
    - 2 PCIe G3 x8 FHHL Slots
    - 2 PCIe G3 x16 LP Slots

    Internal Storage
    - Integrated Storage Controller = None
    - 최대 24개 2.5" NVMe 또는 SAS/SATA 지원
    Internal Storage

    Native I/O
    - 2x USB 3.0 in rear
    - 2x 1G baseT (one shared mgmt) + 1x 1G dedicated IPMI
    - Serial port, VGA port
    - TPM2.0 via Nuvoton NPCT650ABAWX included (for Secure OS and trusted boot)

    RAS
    - Concurrent Maintenance disks
    - Redundant Hot plug Power
    - Redundant Hot plug fans
    - Customer Install and Repair
    - Simplified Op Panel
    - In-rack system service

    Form Factor
    - 19” Rack 2U Server

    BMC Service Processor
    - Aspeed AST2500
    - OpenBMC

    OS Support – LE
    - Linux 전용 시스템

  • RHEL 7.6alt
  • RHEL 8.1 (GA 1.5와 함께 지원 예정)
  • Ubuntu 20.04 (GA 2와 함께 지원 예정)
  • POWER9 IC922 Server(Nvidia T4 GPU 호스팅 능력)

    >POWER9 IC922 Server
    IBM IC922 은 최대 8개의 T4 GPU 장착이 가능하며,
    이중 6개의 full bandwidth 사용이 가능하기 때문에 Intel Xeon Gold 6xxx 서버 대비, 40% 높은 PCIe bandwidth와, 30% 높은 메모리 bandwidth를 제공합니다.

    The need for speed (and accuracy)

    이상적인 조건에서도 단 하나의 모델에 대한 교육은 몇일, 몇 주 또는 몇 달이 걸릴 수 있습니다.
    또한 평균 모델은 일반적으로 프로덕션에 배포되기 전에 5-6 회 훈련됩니다. 모델 교육을위한 성능 향상은 매우 중요하지만 출시 시간의 핵심 가치를 높이려면 속도와 정확성의 조합이 필요합니다.

    "품질, 정확성 또는 수량에 문제가있는 데이터는 의심스러운 AI 모델을 만들어 의심스러운 결과를 생성합니다."

    "Training은 인공 지능의 Magic이 발생하는 곳, 즉 데이터가 AI 모델이되는 곳입니다."

    "모델 Training을위한 성능을 가속화하는 것은 매우 중요하지만 시장 출시 시간에 핵심 가치를 창출하려면 속도와 정확성의 조합이 필요합니다."

    “Inference 단계는 실제로 모든 이전 부분의 집합 입니다. 적절한 Inference가 없다면, 모든 이전의 노력은 헛된 것입니다.”
    POWER9 IC922 Server