近日,第 21 届 FAST ’23 (USENIX Conference on File and Storage Technologies)公布论文入选结果。SmartX 与中国科学技术大学先进数据系统实验室联合研究的成果(FastMove)及论文《Revitalizing the Forgotten On-Chip DMA to Expedite Data Movement in NVM-based Storage Systems》成功入选。

FAST 是由美国高等计算系统协会 (USENIX) 主办的顶级国际会议,也是中国计算机学会 CCF 推荐的 A 类国际学术会议。本次 FAST 从投稿的 123 篇论文中收录 28 篇,接受率为 22.8%。

FastMove 是由先进数据系统实验室博士在读生苏景波、李嘉豪,硕士在读生陈泺帆,李诚特任研究员,许胤龙教授与 SmartX CTO 张凯联合研究的成果。

研究背景

数据密集型应用使用非易失存储介质 NVMM,将数据放置在基于混合内存架构的存储系统中,以实现数据访问的加速。然而,系统在实际运行中,不可避免地在 DRAM 和 NVMM 之间通过 CPU 拷贝数据,带来了计算资源的浪费和性能损失。

主要贡献

FastMove 创新性地利用长期存在但被忽视的片上 DMA 来加速数据移动。该工作主要有三个贡献:

  • 通过详细的性能测试,分析片上 DMA 与 NVMM 结合的潜力和挑战,探索出新的面向延迟的优化方向,并据此设计了一个高性能的 DMA 模块,大大降低了数据拷贝获得收益的大小阈值。 
  • 作为新的数据移动引擎,FastMove 可通过智能调度和负载分割来协调 DMA 和 CPU 的混合使用,从而使 DMA 的局限性得到补偿,并使整体收益最大化。
  • 通过基于内核的通用设计、简单的 API 和 DAX 文件系统的集成,FastMove 允许应用程序透明地利用  DMA 及其新功能,而无需改变代码。

测试数据

研究团队在 NOVA、ext4-DAX 和 XFS-DAX 上运行三个数据密集型应用 MySQL、GraphWalker 和 Filebench,并使用标准基准,如 TPC-C,以及流行的图算法,如 PageRank 等负载,对 FastMove 进行了严格的测试。

在单 NUMA 和多 NUMA 结点的设置中,与传统的仅由 CPU 进行的数据拷贝相比,FastMove 为 TPC-C 与 MySQL 带来了 1.13-2.16 倍的峰值吞吐量加速,将平均延迟降低了 17.7-60.8%,并节省了 37.1-68.9% 用于数据移动的 CPU 使用率。

FastMove 还将图计算任务的执行时间缩短了 39.7-53.4%,并为 Filebench 带来了 1.12-1.27 倍的吞吐量提速。

应用情况

目前,FastMove 已在 SmartX 基于 Intel Optane 的超融合基础架构产品中得到验证,为实现低延迟、高带宽的数据拷贝提供了解决方案。

关于 SmartX

SmartX 作为基础架构领域的创新者,持续探索存储等技术前沿,密切关注着学术界的进展,并积极参与到学术研究中。欢迎有兴趣的实验室与我们合作,落地各类创新研发,共同推进存储行业的发展。

关于先进数据系统实验室

先进数据系统实验室(Advanced Data Systems Laboratory, ADSL)依托于中国科学技术大学计算机科学与技术学院、国家高性能计算中心(合肥)与高性能计算安徽省重点实验室。

实验室致力于以数据为中心的系统软件设计与优化,旨在构建融合高效数据存储、访问、计算为一体的先进数据系统,专注于大规模存储与文件系统、云计算与虚拟化、新型数据库系统、大数据处理系统、资源管理与调度等方向的研究。近五年来,实验室人员在 FAST, OSDI, SOSP, ATC, VLDB, SIGMETRICS, INFOCOM, ICDE, DSN, EuroSys, ToS, TC, TPDS, JSAC, TCAD 等国际顶级会议及期刊上共发表论文 50 余篇,申请国家专利近 20 项。

继续阅读