什么是 DGX Spark?
DGX Spark 是 NVIDIA 的 AI 超级计算工作站,搭载 NVIDIA Grace CPU 和 RTX 5090 GPU。 专为大模型推理、AI 开发和高性能计算设计,提供工作站级的 AI 算力。
我们使用 DGX Spark 运行 vLLM 大模型推理服务,支持 Qwen、GLM 等主流开源模型, 为易佳智点的所有智能体提供强大的 AI 能力支持。
硬件配置
| CPU | NVIDIA Grace (ARM 架构) |
|---|---|
| GPU | NVIDIA RTX 5090 / GB10 |
| 内存 | 128GB+ 统一内存架构 |
| 存储 | NVMe SSD 高速存储 |
| 网络 | 高速以太网 / InfiniBand |
运行的服务
🚀 vLLM 推理
高性能大模型推理服务,支持并发请求处理
🎨 ComfyUI
AI 绘画工作流,支持多种 Stable Diffusion 模型
🔍 Qdrant
向量数据库,支持智能体的语义记忆检索
🤖 图图智能体
部署在 DGX 上的 OpenClaw 智能体实例
性能表现
基于 vLLM 的高效推理架构,DGX Spark 可以同时处理多个并发请求:
| 并发数 | 吞吐量 |
|---|---|
| 并发 1 | 72.85 tokens/s |
| 并发 4 | 192.42 tokens/s |
| 并发 8 | 289.56 tokens/s |
| 并发 16 | 413.75 tokens/s |