DGX Spark 技术

NVIDIA AI 超级计算工作站, powering 大模型推理

什么是 DGX Spark?

DGX Spark 是 NVIDIA 的 AI 超级计算工作站,搭载 NVIDIA Grace CPU 和 RTX 5090 GPU。 专为大模型推理、AI 开发和高性能计算设计,提供工作站级的 AI 算力。

我们使用 DGX Spark 运行 vLLM 大模型推理服务,支持 Qwen、GLM 等主流开源模型, 为易佳智点的所有智能体提供强大的 AI 能力支持。

硬件配置

CPU NVIDIA Grace (ARM 架构)
GPU NVIDIA RTX 5090 / GB10
内存 128GB+ 统一内存架构
存储 NVMe SSD 高速存储
网络 高速以太网 / InfiniBand

运行的服务

🚀 vLLM 推理

高性能大模型推理服务,支持并发请求处理

🎨 ComfyUI

AI 绘画工作流,支持多种 Stable Diffusion 模型

🔍 Qdrant

向量数据库,支持智能体的语义记忆检索

🤖 图图智能体

部署在 DGX 上的 OpenClaw 智能体实例

性能表现

基于 vLLM 的高效推理架构,DGX Spark 可以同时处理多个并发请求:

并发数 吞吐量
并发 1 72.85 tokens/s
并发 4 192.42 tokens/s
并发 8 289.56 tokens/s
并发 16 413.75 tokens/s