近日,中国计算机学会(CCF)公布了 2023 年度“CCF 科技成果奖”评选结果,其中由北京志凌海纳科技有限公司(SmartX)提交的“SMTX OS:全链路 I/O 性能优化的超融合系统”项目荣获 2023 年度“CCF 科技成果奖”科技进步二等奖。
该项目针对云计算平台基础架构软件方面的挑战,在基于非易失性内存的 I/O 性能优化、基于 RDMA 的网络通信优化、以及虚拟硬盘数据零拷贝等方面,取得重要进展。
“CCF 科技成果奖”主要授予在计算机科学、技术或工程领域具有重要发现、发明、原始创新,在相关领域有一定国际影响的优秀成果,该奖项分为自然科学奖、技术发明奖与科技进步奖三个类型。
其中科技进步奖更加关注在计算机及相关领域的技术研究、技术开发、技术创新、科学普及、推广应用先进的科学技术成果、促进高新技术产业化等方面做出重大/重要贡献。
“SMTX OS:全链路 I/O 性能优化的超融合系统”项目以超融合系统中虚拟化和分布式存储的性能不足为切入点,开展了深入研究。当前超融合基础架构已成为全球企业客户构建云基础架构的重要技术方向,可以帮助用户大幅提升基础架构弹性扩展能力,降低总拥有成本和运维难度。
但以虚拟化和分布式存储为核心的超融合基础架构,由于虚拟化数据交换、内部存储网络等环节带来的时延,性能尚无法完全满足金融、医疗等行业核心应用需求。基于以上痛点,SMTX OS 研发团队对超融合基础数据关键路径进行了系统性地研究,完成了以下创新:
- 基于非易失性内存的 I/O 性能优化技术。
在系统中融合 NVM 作为高速缓存并利用 IOAT 技术构建直接访问 NVM 的用户态存储引擎。基于 NVM 的字节寻址特性和 CPU Direct 访问能力,构建了超低延迟的缓存体系和对应的存储日志系统。在保证应对断电等突发异常数据安全的前提下,极大的降低了数据访问延迟。整个系统结合 KVM-QEMU vHost 技术,可以在 3 节点集群提供百万以上 IOPS 的同时将端到端的延迟控制在亚毫秒级别。 - 基于 RDMA 的网络通信优化技术。
通过基于 RDMA 构建的存储节点内部互联网络,在分布式系统中的不同节点之间进行副本数据同步时绕过较重的内核协议栈,避免了数据拷贝开销,从而有效降低网络延迟,提高了系统的吞吐能力。此外,系统通过结合拓扑感知的副本分配策略让数据尽可能的靠近业务虚拟机,减少了对网络流量的占用,进一步在有限的网络流量下提供更多的带宽。 - 虚拟硬盘数据零拷贝技术。
通过和 KVM/QEMU vHost 技术结合的快速存储接入技术和虚拟机状态感知与数据分配调整技术,业务虚拟机的内存空间和数据副本所在的存储服务直接共享。省去了从虚拟机内核到存储协议栈,网络协议栈等一系列涉及到内存拷贝和网络请求处理的复杂过程,减少了 CPU 和内存的资源消耗。
目前本项目已申请发明专利 23 项、软件著作权 30 余项,相关研究已被顶级国际会议 FAST 收录。(点击了解详情:SmartX 与中科大先进数据系统实验室研究成果被 FAST ’23 录用)
此次荣获“CCF 科技成果奖”是对 SmartX 产品与技术能力的又一权威认可,未来 SmartX 将继续推动技术创新和产品研发,以长期主义和工匠精神打造产品,推进产业发展与成果转化,助力更多客户构建更加精简敏捷、可靠安全的现代化 IT 基础设施,实现数字化和信创双重转型。