Falcon 5012

생성형 AI 및 HPC 환경을 위한 엔터프라이즈 PCIe Gen5 GPU 확장 플랫폼

Falcon 5012는 생성형 AI, HPC 및 대규모 GPU 인프라 환경을 위해 설계된 4U 19인치 분리형 GPU 확장 솔루션입니다. GPU Dynamic Provisioning 기술을 통해 GPU 자원을 서버 환경에 따라 유연하게 분배할 수 있으며, AI Infrastructure 및 Multi-host GPU Resource Pool 환경에 최적화되어 있습니다.

Falcon 4205 제품 이미지

개요

PCIe Gen5 GPU 솔루션으로 생성형 AI 혁신: 증가하는 요구사항 충족

 

PCIe Gen5 GPU 솔루션은 생성형 AI 분야를 혁신하며, 대규모 GPU 독립 배포를 가능하게 함으로써 급증하는 수요를 충족합니다. 이는 컴포저블 아키텍처(composable architecture)와 컴포저블 디스어그리게이션(composable disaggregation)이라는 혁신적인 접근 방식을 통해 구현되었으며, 데이터 집약적인 작업에 큰 영향을 미칩니다.

이 솔루션은 전송 속도와 전체 성능을 향상시키는 동시에 GPU를 서버로부터 분리하여 더욱 높은 유연성과 확장성을 제공합니다. 또한, 독립적인 GPU 확장을 통해 하드웨어 관리가 단순화되어 비용 절감에도 기여합니다.

결과적으로 PCIe Gen5 GPU 솔루션은 생성형 AI 환경에서 요구되는 막대한 GPU 수요를 충족시키며, 향상된 성능, 유연성, 그리고 비용 효율성을 제공합니다.

차세대 시스템 다이내믹스: 혁신적인 GPU 기능

시스템 다이내믹스를 혁신하는 Falcon 5012는 고급 GPU 관리 기능을 도입하여 최대 8개의 호스트가 필요에 따라 10개의 장치를 동적으로 공유할 수 있도록 합니다. 이를 통해 자원 할당이 간소화되어 설정 시간을 크게 절약할 수 있습니다.

이 솔루션은 호스트 간 GPU 자원의 원활한 추가 및 제거를 가능하게 하며, 지능적인 재배치를 보장합니다. IT 관리자는 통합 하드웨어 및 소프트웨어 솔루션을 활용하여 구성 요소 관리보다 인사이트 확보에 더 집중할 수 있습니다.

Falcon 5012는 작업 흐름을 더욱 효율적이고 효과적으로 만들어줍니다.

각 슬롯 450W 전원 공급

RESTful API 및 GUI를 통한 종합 자원 관리

Falcon 5012는 전략적인 자원 관리를 통해 최적의 시스템 성능을 보장합니다. 호스트와 장치 포트 모두에서 GPU 상태, 실시간 성능, 오류를 적극적으로 모니터링함으로써 안정적인 운영을 위한 빠른 문제 식별과 해결이 가능합니다.

유연한 스위치 캐스케이드 토폴로지와 구성 가능한 호스트 가상 트리를 도입하여 자원 관리의 유연성을 높였습니다. 또한, Host 및 GPU 뷰를 통해 직관적인 자원 할당 정보를 제공하여 지능적인 자원 배치를 가능하게 합니다.

웹 기반 GUI 대시보드
Falcon 5012 Specification

Software Features

Features
  • GPU composability
  • GPU hotplug
  • GPU peer to peer (GPU P2P)
  • PCIe port configuration to host/device ports
  • Power control of a single PCIe slot
  • GPU health information
  • Performance and error monitoring of host and device ports
  • Flexible switch cascade topology
  • Flexible switch fabric topology
  • Configurable host virtual tree
  • Host view of assigned GPU
  • GPU view of assigned host
  • Temperature threshold setup
  • Device overheated protection
  • Firmware secure boot
  • Link capability and status of devices
  • User authentication management
  • 256bit encryption of sensitive data
  • Sha128 encryption
  • ELK central log server integration
Management Interface
  • Redfish®
  • RESTful API
  • GUI
System Management
  • H3 management center
  • Real-time GPU cluster topology
  • Dashboard for GPU utilization, performance and other information
  • Predictive health monitoring
  • Role-based authentication and access control

 

Hardware Features

Model NameFalcon 5012
BMCAST 2500
mCPUIntel ATOM X86 CPU
PCIe SwitchBroadcom PEX 89144 PCIe 5.0 switch
Device
  • GPU, FPGA, network card, and other standard PCIe device (add-in card)
  • Dual-slot width and 10.5” length
  • Supports up to 600W GPU
Host Interface – Standard mode
  • One (1) PCIe 5.0 x16 CDFP connector
  • Need one HBA (host bus adapter) card on server host
  • 1m CDFP cable
Host Interface – Advanced mode
  • Up to Four (4) PCIe 5.0 x16 ports for host connections
  • Need HBA (host bus adapter) cards on server hosts
  • 1m CDFP cables
Operating temperature10 degrees Celsius ~ 35 degrees Celsius (50 degrees Fahrenheit ~ 95 degrees Fahrenheit)
Ethernet Ports
  • RJ45 of mCPU for memory management
  • RJ45 of BMC for chassis management
Power
  • Four (4) pieces 2100W or 3200W
  • (2+2 or 3+1 redundant)
  • Back removable, hot-swap
Fan
  • 8 80x80mm dual rotor fans
  • Hot-swap
Dimension4U; 175(H) X 448(W) X 650(D)mm

 

Compatible Device

Accelerator
  • NVIDIA A100, A40, A30, A16, A10
  • NVIDIA RTX 6000 PRO, RTX A6000, RTX A5000, RTX A4000
  • NVIDIA GeForce RTX 4090, GeForce RTX 4080, GeForce RTX 3090
  • NVIDIA H200, H100
  • AMD Radeon Instinct™ MI60, MI50, MI25
  • AMD Alveo™ U50

Falcon 5012 기술 사양
Falcon 5012 사용자 매뉴얼
Falcon 5012 빠른 설치 가이드

Falcon 5012 Gallery

AI Infrastructure 구성 예시

Falcon 5012는 다양한 AI 및 HPC 환경에 맞춰 유연한 GPU 자원 구성이 가능하도록 설계되었습니다. GPU Dynamic Provisioning 기술을 통해 GPU 자원을 서버 환경에 따라 효율적으로 분배할 수 있으며, 다중 호스트 구성을 통해 GPU 활용도를 극대화할 수 있습니다.

  1. 단일 호스트 GPU 구성

단일 서버 환경에서 GPU 자원을 집중적으로 활용할 수 있는 구성입니다. AI 학습 및 고성능 연산 환경에 적합합니다.

Falcon 4205 x16 슬롯 1개, 호스트 1개, 서버 1개

  1. 듀얼 호스트 GPU 구성

두 개의 서버 환경에서 GPU 자원을 효율적으로 공유할 수 있는 구성입니다. AI 추론 및 병렬 연산 환경에 적합합니다.

Falcon 4205 x8 슬롯 1개, 호스트 2개, 서버 2개

  1. 고성능 듀얼 호스트 GPU 구성

고성능 듀얼 호스트 환경을 위한 구성입니다. 대규모 AI 학습 및 HPC 워크로드 환경에서 높은 GPU 처리 성능을 제공합니다.

Falcon 4205 x16 슬롯 2개, 호스트 1개, 서버 2개

  1. 멀티 호스트 GPU 구성

여러 서버 환경에서 GPU 자원을 유연하게 공유할 수 있는 구성입니다. AI 인프라 운영 효율성과 확장성을 향상시킬 수 있습니다.

Falcon 4205 x4 슬롯 1개, 호스트 4개, 서버 4개

  1. 고밀도 멀티 호스트 GPU 구성

고밀도 멀티 호스트 환경에서 GPU 자원을 효율적으로 분배할 수 있는 구성입니다. 다양한 AI 및 HPC 워크로드 환경에 유연하게 대응할 수 있습니다.

Falcon 4205 x8 슬롯 2개, 호스트 2개, 서버 4개

  1. 대규모 GPU Resource Pool 구성

대규모 GPU Resource Pool 환경을 위한 구성입니다. 다수의 서버가 GPU 자원을 공유할 수 있어 AI 클러스터 및 HPC 환경에 적합합니다.

Falcon 4205 x4 슬롯 2개, 호스트 4개, 서버 8개