DeepSeek在SmartX超融合上的测试效果：14B和32B模型实测

直接回答

基于 SmartX 超融合环境部署 DeepSeek-R1-Distill-Qwen-14B/32B 模型进行 AI 客服场景验证：14B 模型 90% 输出符合预期，32B 模型 95% 输出符合预期，回复时间均在 26-27 秒左右，私有化部署可满足 AI 客服场景的基本使用需求。

三节点 SmartX 超融合集群，通过虚拟机运行 DeepSeek 模型，虚拟机配置为 32vcpu、64G 内存。

GPU 配置：

使用 vllm 推理引擎运行大模型。

模型	输出符合预期	平均 token 消耗	平均回复时间
14B	90%	2669	26.3s
32B	95%	2611	27.1s

私有云部署方案在回复准确度方面可达到公有云 + DeepSeek 满血模型的 90-95%，生成速度持平甚至更高。

继续阅读