实践背景
复旦大学智能计算专用平台 CFFF(Computing For the Future at Fudan)是全国高校最大的云上科研智能计算平台,包含了面向多学科融合创新的 AI for Science 计算集群“切问 1 号” 和面向计算科学高精尖研究的专用高性能计算集群的“近思 1 号”,算力总规模达到 28 PFlop/s。其中,“切问 1 号”平台需要实现数据高速的存储与跨城高速传输,因此在基础架构选型中,复旦大学聚焦厂商对 RDMA 的支持能力。
针对 RDMA 支持能力开展验证
复旦大学了解到 SmartX 超融合在存储接入网络和存储内部数据同步网络中均可支持 RDMA 后,主动与 SmartX 联系进行 RDMA 流控验证,其中存储网配置采用 100Gb 网卡,并对双端口做了动态聚合 ,在未配置 RDMA 时,测试流量带宽约为 6GB,后续进行 RDMA 配置后,流量带宽提升至 19GB,提升 216.67%。
6 节点 SmartX 榫卯超融合承载大规模数据高速交换
基于测试结果,复旦大学决定采购 6 节点 SmartX 超融合软件,搭配 AMD CPU 9000 系列,采用 NVMe 缓存 + NVMe 全闪配置,以保障性能,并使用 25GbE 业务网络 + 100GbE 存储网络 + RDMA 以保障性能和数据传输效率。整套系统为不同城市校区与智算集群之间的交换数据,提供了高性能、高可用、可弹性扩展的中转平台。
榫卯超融合产品组合介绍
本文档介绍了榫卯超融合的价值特性、核心产品、应用场景与功能规格。
SmartX 超融合技术原理与特性解析合集(一)虚拟化与存储
深入解读快照、缓存、I/O 路径等关键技术与特性,包含与 VMware 和 Nutanix 的详细对比。
SmartX 超融合技术原理与特性解析合集( 二)管理与运维
深入解读磁盘亚健康检测、存储性能管理、升级、扩容、迁移等关键技术与特性。
SmartX 超融合技术原理与特性解析合集(三)全栈能力
深入解读容器管理与服务、网络与安全、备份与容灾相关技术原理与特性。
SmartX ELF 虚拟化核心功能集
全面替代 VMware 的云化解决方案。
VMware 升级替代专题
4 大章节,100+ ⻚干货内容,详解替代方案、产品功能与企业实践,渐进式 实现 VMware 虚拟化与全栈产品的升级替代。
