全国高校最大的云上科研智能计算平台——复旦大学智能计算专用平台 CFFF(Computing For the Future at Fudan) “切问一号“、“近思一号”正式上线。

CFFF 包含了面向多学科融合创新的 AI for Science 计算集群“切问 1 号” 和面向计算科学高精尖研究的专用高性能计算集群的“近思 1 号”,算力总规模达到 28 PFlop/s,通过高速光纤环网连通内蒙古和上海,覆盖复旦大学四校区的智算集群,提供超千卡并行智能计算,支持千亿参数的大模型训练,在国内高校尚属先例。

转型背景

在数据传输方面,“切问 1 号”平台需要实现数据高速的存储与跨城高速传输,以及数据自动分级存储使用技术支撑,以满足不同场景下的科学智能研究与应用需求,针对 IT 基础架构建设,其具体需求包括:

建设符合数据高效存储与传输需求的云化基础架构,同时满足性能、灵活性、易管理以及本地高可用的需求;

基础架构的节点数量可按需扩展,且起配节点数量尽量少,以有效利用资源;

需要对 25GbE 与 100GbE 网络与 RDMA (Remote Direct Memory Access )有良好的支持,以保证数据读写和传输的效率需求,且需通过功能与性能方面的 POC 测试。

亮点
SmartX 超融合在存储接入网络和存储内部数据同步网络中均可支持 RDMA
6 节点 SmartX 超融合承载大规模数据高速交换
收益
整套系统为不同城市校区与智算集群之间的交换数据,提供了高性能、高可用、可弹性扩展的中转平台。
关键应用
云上科研智能计算平台
文档