0 0 % UP % 提升 Concurrent Users 並行使用者
Up to 5× more concurrent users on the same GPU infrastructure — validated on PRO6000 and H200 nodes. 在相同 GPU 基礎設施上最高 5 倍並行使用者 — PRO6000 與 H200 節點實測驗證。
Pre-integrated GPU servers with aiDAPTIV Middleware and aiDAPTIV Cache Memory NAND Flash — extending AI memory, reusing KV cache across inference sessions, and supporting up to 5× more concurrent users on the same infrastructure. 預整合 aiDAPTIV Middleware 與 aiDAPTIV Cache Memory NAND Flash 的 GPU 伺服器,擴展 AI 記憶體容量、跨推理工作階段重用 KV Cache,在相同硬體規模下支援最高 5 倍並行使用者。
Up to 5× more concurrent users on the same GPU infrastructure — validated on PRO6000 and H200 nodes. 在相同 GPU 基礎設施上最高 5 倍並行使用者 — PRO6000 與 H200 節點實測驗證。
Train and serve LLMs up to 800B parameters with aiDAPTIV Cache Memory memory extension. 搭配 aiDAPTIV Cache Memory 記憶體延伸,支援最高 800B 參數模型訓練與推理。
Traditional GPU servers rely on HBM, DRAM, and SSD tiers alone. Phison aiDAPTIV extends AI memory with aiDAPTIV Middleware and aiDAPTIV Cache Memory NAND Flash. 傳統 GPU 伺服器僅依賴 HBM、DRAM 與 SSD 分層。Phison aiDAPTIV 透過 aiDAPTIV Middleware 與 aiDAPTIV Cache Memory NAND Flash 延伸 AI 記憶體。
Compare concurrent user capacity and inference metrics with and without aiDAPTIV on the same GPU server infrastructure. 在相同 GPU 伺服器基礎設施上,比較啟用 aiDAPTIV 前後的並行使用者容量與推理指標。
Phison aiDAPTIV expands effective AI memory in software — no extra GPUs required. Same hardware, up to 5× more concurrent users. Phison aiDAPTIV 透過軟體層擴展有效 AI 記憶體,無需增購 GPU,即可在相同硬體上大幅提升並行使用者容量。
Multi-GPU DAS benchmark — concurrent users, TTFT, and TPS with and without aiDAPTIV. 多 GPU DAS 基準測試 — 比較啟用 aiDAPTIV 前後的並行使用者、TTFT 與 TPS。
| GPU GPU | Model 模型 | Cache 快取 | Users 使用者 | TTFT TTFT | TPS TPS | |
|---|---|---|---|---|---|---|
| Without aiDAPTIV 未啟用 aiDAPTIV aiDAPTIV enabled aiDAPTIV 已啟用 | 10 40 | 6.7s 2.3s | 28.3 28.0 | |||
| Without aiDAPTIV 未啟用 aiDAPTIV aiDAPTIV enabled aiDAPTIV 已啟用 | 20 60 | 10.1s 2.6s | 18.8 21.3 | |||
| Without aiDAPTIV 未啟用 aiDAPTIV aiDAPTIV enabled aiDAPTIV 已啟用 | 20 100 | 7.4s 8.3s | 21.7 22.2 | |||
| Without aiDAPTIV 未啟用 aiDAPTIV aiDAPTIV enabled aiDAPTIV 已啟用 | 60 180 | 9.3s 9.9s | 16.5 17.7 |
Pre-integrated DAS architecture options from 4U RTX to 8U HGX — each paired with aiDAPTIV Cache Memory for training and inference at scale. 從 4U RTX 到 8U HGX 的預整合 DAS 架構選項,每款皆搭配 aiDAPTIV Cache Memory,支援大規模訓練與推理。
| CPU CPU | 2 × 12 Cores 2 × 12 核心 |
|---|---|
| aiDAPTIV Cache Memory aiDAPTIV Cache Memory | 2 × AI100E 2TB or 4 × AI100E 2TB 2 × AI100E 2TB 或 4 × AI100E 2TB |
| System Memory 系統記憶體 | 512 / 1024 GB 512 / 1024 GB |
| LLM Model Size (Training) LLM 模型規模(訓練) | < 200B / 400B < 200B / 400B |
| Concurrent Users* (Inference) 並行使用者*(推理) | 10 40 |
| Power Spec. 電源規格 | Max. 6 kW (Avg. 2 kW / 3 kW) 最大 6 kW(平均 2 kW / 3 kW) |
| CPU CPU | 2 × 32 Cores 2 × 32 核心 |
|---|---|
| aiDAPTIV Cache Memory aiDAPTIV Cache Memory | 2 × AI100E 2TB or 4 × AI100E 2TB or 4 × AI200E 4TB 2 × AI100E 2TB 或 4 × AI100E 2TB 或 4 × AI200E 4TB |
| System Memory 系統記憶體 | 256 / 512 / 1024 GB 256 / 512 / 1024 GB |
| LLM Model Size (Training) LLM 模型規模(訓練) | < 200B / 400B / 800B < 200B / 400B / 800B |
| Concurrent Users* (Inference) 並行使用者*(推理) | 20 60 |
| Power Spec. 電源規格 | Max. 12 kW (Avg. 2 kW / 3 kW / 6 kW) 最大 12 kW(平均 2 kW / 3 kW / 6 kW) |
| CPU CPU | 2 × 48 Cores 2 × 48 核心 |
|---|---|
| aiDAPTIV Cache Memory aiDAPTIV Cache Memory | 4 × AI200E 4TB 4 × AI200E 4TB |
| System Memory 系統記憶體 | 2048 GB 2048 GB |
| LLM Model Size (Training) LLM 模型規模(訓練) | ≤ 800B ≤ 800B |
| Concurrent Users* (Inference) 並行使用者*(推理) | 20 100 |
| Power Spec. 電源規格 | Max. 18 kW (Avg. 12 kW) 最大 18 kW(平均 12 kW) |
| CPU CPU | 2 × 64 Cores 2 × 64 核心 |
|---|---|
| aiDAPTIV Cache Memory aiDAPTIV Cache Memory | 4 × AI200E 4TB 4 × AI200E 4TB |
| System Memory 系統記憶體 | 3072 GB 3072 GB |
| LLM Model Size (Training) LLM 模型規模(訓練) | ≤ 800B ≤ 800B |
| Concurrent Users* (Inference) 並行使用者*(推理) | 60 180 |
| Power Spec. 電源規格 | 36 kW (Avg. 14 kW) 36 kW(平均 14 kW) |