近些年,企业应用产生的非结构化数据(文档、图片、报表、音视频等)正在呈指数级增长——根据 Gartner1 的预测,到 2026 年,大型企业各平台应用产生的非结构化数据量将达到 2023 年的 3 倍。海量的非结构化数据及其快速的增长趋势,也为企业的数据存储带来了新的挑战:不仅需要大容量,还需要灵活、经济、可持续地进行扩容,并且不增加运维负担。同时,AI/HPC 应用带来的大数据分析与处理场景,还对存储的性能以及存储与计算资源的统一管理提出了更高的要求。

面对这些复杂的需求,企业应选择哪种存储方案支持非结构化数据?以下,我们将介绍几种常见的存储方案,包括集中式 NAS 存储、分布式存储、自建文件服务器,并分析其优缺点,为用户提供参考。

​常见非结构化数据存储方案对比​

1. 集中式 NAS 存储

集中式 NAS 存储是国内用户使用比较多的非结构化数据存储方案。这些方案基于集中式存储架构,可支持常见文件存储和对象存储协议(一些方案还可支持块存储协议),配置和单独管理也较为简单,适用场景比较宽泛,因此得到很多中小企业的广泛使用。

不过集中式存储扩展难度较大,而且高度绑定硬件,面对快速增长的非结构化数据,企业可能需要频繁采购存储硬件,运维人员也需要投入大量时间精力进行扩容改造,导致长期使用成本大大增加。另外,由于集中式存储存在并发性能瓶颈和单点故障风险,扩容时也无法同步提升性能,这种存储方案难以应对存在大量并发访问、对性能要求较高的应用场景,比如 AI 模型训练、数名医生同时调阅 PACS 影像数据等。一些高端集中式统一存储方案能通过高性能硬件(如全闪)提升性能,不过这些方案成本更高,长期使用比较考验企业的经济实力。​

2. 分布式存储

相对来说,分布式存储是一种更为灵活便捷、扩展和管理成本更低的方案。得益于分布式架构,分布式存储在高并发访问下仍可提供较高的性能,同时避免了单点故障风险,提升数据可靠性,因此更适合非结构化数据量快速增长、对性能要求较高的应用场景。

不过,目前很多分布式存储方案仍采用独立部署的形式,需要用户同时准备计算节点和存储节点。尤其是在大容量备份、制造业 AI 质检、 电子设计自动化(EDA)等场景,对计算资源的需求也相对较高,用户需要同时投入多套设备,分别建设、管理和运维计算和存储资源池,整体的投入成本和运维成本都比较高。国产分布式存储方案也比较考验厂商的技术实力和生态兼容性,需要用户在前期进行充足的调研和验证。

3. 自建文件服务器

一些预算有限、日常非结构化数据存储需求不高,或对数据隐私比较敏感的用户,也可能选择自建文件服务器的方案。这种方案在采购成本上更低,但也非常考验用户的技术能力,从前期的搭建、配置、数据冗余与安全建设再到后期的运维,都需要用户自己完成。

总结 – 常见非结构化数据存储方案对比

可以看到,以上三种常见的存储方案在能力方面各有千秋,适用场景也不尽相同,因此用户在选择存储方案时需要结合实际业务需求进行评估。另外值得注意的是,在成本层面,集中式 NAS 存储和独立部署的分布式存储都需要用户投入额外的硬件资源、进行独立的运维管理。有没有一套方案,能够以统一的基础设施同时提供高性能、易扩展的计算与存储资源,帮助用户进一步节约成本、简化架构、方便运维?

SmartX HCI 6.0:融合计算与存储,提供块存储级别的性能与文件存储级别的容量

作为国内领先的专业超融合厂商,SmartX 的 HCI 6.0 版本新增文件存储功能 SMTX File Storage(SMTX 文件存储,简称“SFS”),一套超融合架构同时提供高性能的分布式块存储与分布式文件存储,帮助企业以一套硬件资源池满足多种业务应用的计算和存储需求,降低整体建设/扩容成本与运维难度。

SFS 基于 SmartX 超融合部署,由 SmartX 超融合集群中的分布式块存储提供底部持久化块存储,搭配多种企业级高可用功能,可同时满足文件类应用大容量、高性能、易扩容、高可靠、低成本、统一运维等方面的存储需求。得益于 SFS,用户可以使用 SmartX 超融合支持以下场景:

  • 为医疗 PACS 系统等性能-容量均衡型应用场景提供大容量文件存储资源池。
  • 无需独立的备份服务器硬件,同时运行备份应用并提供大容量备份资源池。
  • 搭配容灾方案打造灾备一体化平台,同时提供备份以及应急拉起所需的算力和存储空间。
  • 同时为 AI/HPC 应用场景提供 GPU 资源与高性能存储支持。

欲深入了解,请阅读:

您还可下载《SMTX 文件存储用户指南》,进一步了解 SFS 功能特性与部署操作。

参考文章:

1. Modernize Your File Storage and Data Services for the Hybrid Cloud Future,Gartner,2023

https://www.gartner.com/document-reader/document/4142399?ref=solrAll&refval=426385462

继续阅读