作者:SmartX 金融团队 徐鑫

在上期文章常见误区解读:超融合不是云,是过渡性产品和技术,不能满足建云需求?中,我们针对超融合的建云能力进行了详细解读。除了建云方面的误区,部分 IT 管理者和技术负责人还会认为:“超融合适合科技力量薄弱的小客户做虚拟化、小规模场景,真正的大规模生产系统,恐怕还是传统架构或者上私有云稳妥。”
类似的声音,经常在金融等对 IT 系统稳定性、性能要求极高的行业出现。甚至有不少企业的技术团队在讨论是否采用超融合时,会提出这样的问题:

  • (厂商)有多少个上百节点甚至上千节点的落地案例?
  • 真的有企业会把重要生产交易/支付这种高要求的业务跑在超融合上?
  • 分布式架构扩展容易,但性能瓶颈怎么解决?稳定性真能有保障吗?

这些疑问某种程度上体现了行业在面对超融合技术时的深入思考,尤其是在大规模、复杂、重要生产场景落地时的谨慎态度。而随着越来越多的企业用户基于 SmartX 企业云平台推进超融合大规模部署,并承载重要生产业务应用,很多企业用户也逐渐认识到,基于超融合架构的 SmartX 企业云平台凭借其完整的分布式、云化架构,能够支撑上百节点的集群建设,其分布式存储与虚拟化深度融合,也可充分满足重要生产交易/支付、数据库等关键业务系统的严苛要求。以下,我们将以 SmartX 企业云平台为例,针对上述超融合“误区”进行“辟谣”!

厘清误区

看法一:超融合只能跑小规模,难以承担大规模重要生产系统

❌ 误区成因
许多企业,尤其是金融机构,在讨论 IT 架构转型时,仍普遍将超融合等同于“轻量化平台”“适合测试或办公场景”,而不是承担核心系统的基础设施。
早期超融合的落地场景确实多为测试环境、虚拟桌面、非核心系统等低风险场景。由于具备“软硬一体、快速上线、统一管理”等优势,超融合被广泛视为适合中小规模场景、帮助企业快速构建私有云的工具,厂商和媒体的早期宣传对其在核心生产系统中的支撑能力,探讨和验证也相对较少。
另外,由于金融行业对信息安全和系统合规有严格要求,超融合在核心业务场景的大规模落地案例往往难以公开:一方面,很多人认为“核心业务不能跑在超融合上,因为没看到成功案例”;另一方面,很多真正跑在超融合上的核心业务,由于安全合规原因又无法公开示范,导致行业认知长期被滞后阻碍。
✅ 基于 SmartX 企业云的真实情况
基于超融合架构的 SmartX 企业云平台具备完整的分布式、云化设计,能够平滑支撑从几十节点到百节点以上的持续扩展,满足核心数据库、账务、支付、信贷等系统的大规模、高并发、持续增长需求:
-支持跨数据中心、跨业务区的统一基础设施规划,满足不同业务系统差异化的资源诉求。
-针对多数据中心的异构架构与差异化需求,具备灵活的横向扩展、分区域部署与集中管控能力。
-顺应金融行业渐进式、分阶段转型的特性,支持从单一重要系统切入,逐步覆盖到全部重要或核心业务,避免“一步到位”带来的高风险。
-在银行、证券、保险等金融细分领域,均有头部用户部署几百甚至上千节点 SmartX 企业云基础设施集群并支持核心业务系统与数据库的长期实践案例。

看法二:超融合性能和稳定性不如传统高端存储,跑不动核心数据库

❌ 误区成因
相比传统集中式存储和高可用集群架构,超融合采用了更复杂的分布式架构设计——数据在多节点之间分布、冗余存储,资源动态调度。这种模式在小规模场景下运转良好,但如果规模扩展到数百甚至上千节点时,便容易引发技术团队对一致性、性能瓶颈、资源争抢、故障恢复等方面的担忧。
同时,由于金融行业长期依赖高端集中式存储,担心分布式架构无法满足核心系统如数据库、支付系统等极高性能和稳定性要求,尤其关注在极端负载下的持续服务能力和故障应对。
在分布式系统领域,确实存在“规模越大,复杂度和不可预期性就越高”的情况。对于缺乏大规模超融合实践经验的团队而言,这种架构往往会被认为“理论上强大,实践中风险”。
✅ 基于 SmartX 企业云的真实情况
SmartX 企业云平台通过分布式存储与虚拟化深度融合,提供媲美甚至优于高端集中存储的性能,满足核心数据库、支付等关键系统在高并发、低时延场景下的严苛需求。同时,依托分布式架构天然具备的高可用、高容错能力,避免单点故障,保障核心业务持续稳定运行:
分布式架构支持按需弹性扩展能够突破集中式架构的性能瓶颈,随节点增加线性提升整体性能与容量,支撑银行、证券、保险等各细分金融行业重要生产系统业务量快速增长。
-面向未来,具备信创AI边缘计算等新型业务的兼容能力,确保超融合平台不仅具备当前核心业务所需的高性能和稳定性,也具备面向未来的技术先进性与持续演进能力,避免平台老化、架构固化等问题。

看法三:超融合难以满足核心系统复杂的网络隔离和安全合规要求

❌ 误区成因
相比传统架构中通过物理隔离、专用网络设备搭建明晰的安全边界来实现监管要求,超融合平台通常将计算、存储、网络、安全等多个组件集成在同一平台中,形成“高度一体化”的形态。
这在带来管理便利的同时,也被很多人视为“潜在风险点”:一体化平台的网络隔离能力够强吗?虚拟化资源之间是否能实现多租户的严格隔离?审计、加密、访问控制这些关键安全能力,是否真的达到监管要求?
此外,很多技术团队担心:一旦业务复杂性提升,例如涉及多个业务域、租户或合规区块,是否会因为超融合平台“整合过度”,而导致系统边界模糊、隔离能力变弱、安全责任不清?
这类质疑广泛存在于银行、保险、证券等多个行业,并直接影响了超融合是否能进入“核心系统区”的战略决策。
✅ 基于 SmartX 企业云的真实情况
SmartX 企业云平台具备符合金融监管要求的安全架构设计,能够支撑核心系统的多租户、分区隔离、审计等复杂场景:
-通过虚拟私有云(VPC)、分布式虚拟交换机(DVS)、微分段(DFW)等机制,确保业务、租户、系统多层安全隔离,动态适应业务调整。
提供全链路合规安全方案,涵盖国密算法、操作审计、合规对接,符合多项监管标准,保障核心系统上云过程中安全不降级。

看法四:超融合容灾能力不足,难以保障核心业务连续性

❌ 误区成因
在一些技术团队看来,传统的“两地三中心”、集中式 SAN 存储 + 计算分离的模式,虽然复杂、昂贵,但“用的人多”,因此成为“最安全的选择”。
超融合虽然在理论上具备分布式容错、数据冗余等安全机制,但一旦规模扩大并用于承载“核心业务”,很多决策者还是倾向于依赖“用得久、跑得稳”的老方法。
✅ 基于 SmartX 企业云的真实情况
SmartX 企业云平台已全面具备符合金融重要生产系统标准的容灾方案:
分布式副本纠删码(EC)机制,实现单节点/机柜/数据中心级故障自动切换,无单点故障风险,业务不宕机。
同城双活异地异步复制组成“两地三中心”架构,支持核心系统同城实时同步,满足 RPO=0、RTO 分钟级的银行业务连续性标准,同时支持异步复制至跨城域数据中心。
-针对多数据中心的分布式架构,支持统一容灾编排、跨平台自动切换,降低传统容灾复杂度,提升容灾响应速度和可靠性。
-面向未来,具备支持信创适配、混合云容灾等新型容灾场景的能力,确保平台长期可用、可扩展。

企业实践:大规模部署超融合集群,覆盖多个分支机构及应用场景

1. 某国有银行:总行+分行部署 1500+ SmartX 超融合节点,支撑核心业务系统

某国有银行作为国内领先的大型商业银行,面对日益增长的业务需求和数字化转型的挑战,选择了 SmartX 企业云平台,并在全国范围内进行规模化部署,实现了统一管理和高效运维,为金融行业的数字化转型树立了典范。

合作历程:稳步推进,持续演进

  • 初期评估与试点阶段:该行对市场上的主流超融合厂商进行全面评估,筛选符合其严格标准的解决方案,并进行小规模试点,验证超融合架构的适用性和可行性。
  • 多场景部署与架构探索阶段:在多个数据中心针对不同应用场景进行部署,并开始探索从非信创架构向全面信创架构的过渡,为后续的大规模部署奠定了基础。同时面对行内多种管理平台和基础架构形态共存的复杂环境,该行逐步形成了混合架构的管理模式,为后续的统一管理积累了经验。
  • 总行规模化部署阶段:基于前期的成功实践和多年的使用经验,完成了总行多个数据中心的超融合资源池建设,标志着其超融合应用进入了规模化部署阶段。
  • 全国分行推广阶段:该行总行正式启动了在 30+ 分行推广超融合架构的计划,在全国范围内形成了多架构共存的局面,实现了从总行到分行的大规模覆盖。

超融合应用:多场景覆盖,多架构并存

该行在多个数据中心部署了 SmartX 超融合集群,覆盖多种业务场景和应用类型:

  • 生产类业务系统:包括核心业务系统,采用多活方式部署,保障业务的连续性和高可用性。
  • C/D 类业务系统:包括生产系统、开发测试系统等,支持多种应用。
  • 数据库:通过高性能集群支持多种数据库系统,满足不同业务的数据存储和访问需求。
  • 信创转型并举:该行在现有 IT 架构基础上,稳步推进信创技术应用,实现了信创与非信创集群的并行部署和兼容过渡。

大规模部署:覆盖全国,规模显著

截至 2024 年底,该行已经在全国范围内实现了 SmartX 超融合集群大规模部署,总节点数超过 1500:

  • 总行数据中心:包括多个数据中心,承载大量核心业务系统。
  • 开发中心、卡中心、共享中心:分别部署了不同规模的节点和集群,支持各自的业务系统。
  • 30+ 省级分行:在全国 38 家省级分行的数据中心(包括生产、灾备和开发测试环境)均部署了 SmartX 超融合架构,实现了全国范围的覆盖。

统一管理:CloudTower Commander 助力高效运维及快速响应(进一步规划中)

面对如此大规模的超融合部署,统一管理至关重要。该行通过 SmartX CloudTower Commander 实现了对总行和分行所有超融合集群的统一管理,极大地提升了运维效率和响应速度。

  • 集中监控与全局视图:CloudTower Commander 提供了集中监控和全局视图功能,使总行管理人员能够全面掌握所有集群的资源使用情况、性能指标和健康状态。
  • 统一运维与标准化操作:总行可以将最佳实践和标准化配置通过 CloudTower Commander 快速推广到各分行,确保所有集群的配置一致性和安全性。
  • 快速响应与技术支持:基于总行多年的 SmartX 运维经验,结合 CloudTower Commander 提供的监控数据和报警信息,总行技术团队可以快速诊断和解决各分行遇到的问题。
  • 自动化部署与批量操作:CloudTower Commander 简化了部署过程,并支持导出报表,方便总行进行资源统计和分析。

2. 某头部券商:陆续部署 1400+ SmartX 超融合节点,推进信创转型

作为国内领先的证券公司,某证券公司的 IT 基础设施需要支撑海量的交易和非交易业务,对稳定性、性能、安全性以及自主可控都有着极高的要求。为了应对不断增长的业务需求、提升 IT 效率并响应国家信创战略,该券商经历了从传统架构到多种超融合方案的探索,最终选择 SmartX 超融合作为基础架构之一,并在全国范围内进行了大规模部署,构建了稳固的金融云底座。

IT 基础设施的演进与选型:从超融合转型到国产化改造

该证券公司的 IT 基础设施建设经历了从传统架构到超融合架构的演进,并积极拥抱国产化方案:

  • 早期超融合探索(2016 年): 该券商开始关注并尝试超融合技术,初期采用了 Nutanix、Hyperflex、VxRail 等国外厂商的产品,主要用于外围系统 POC 和部分生产环境。
  • 国产化选型(2017 年): 随着国内超融合技术的发展和信创战略的提出,用户开始将目光投向国内厂商,对多家国内超融合解决方案进行了考察和测试,其中包括 SmartX。
  • 选型考量与最终选择:多家厂商参与选型,该券商综合考量了产品技术、生态兼容性、性能表现、服务支持和长期发展战略等因素,最终选择了 SmartX,其在与现有云管平台的集成方面展现了良好的兼容性,降低了集成难度。

大规模部署与持续扩展:从 IDC 到核心交易和信创场景

自 2017 年底起,该券商稳步推进 SmartX 超融合的部署与扩展,并逐步将其应用于核心交易系统和信创场景。

初期,超融合主要部署在 IDC 环境,用于互联网应用,为后续大规模部署积累了经验。2019 年,该证券迎来关键突破。在经历了券商行情带来的业务高峰考验后,该证券更加认可 SmartX 超融合出色的弹性拓展能力、快速交付能力和稳定性,开始基于 SmartX 超融合搭建核心业务资源池。

随后,该证券进入规模化扩展阶段,不断升级集群配置,并开始在仿真场景使用多硬件厂商的高性能配置混合部署,以满足日益增长的业务需求。同时,在替换 OpenStack 的过程中,针对不同业务场景,分别采用了两种差异化架构以实现降本增效:一方面,将原有 24 节点的集群,替换为 18 节点的存算分离架构,有效提升了存储资源的独立扩展能力;另一方面,将原有 100 节点集群,优化为 40 节点的超融合架构,显著降低资源占用和运维复杂度,更贴合实际应用需求。

目前 SmartX 超融合已应用于该券商全国多个数据中心,承载了包括核心交易系统、信创系统在内的各类关键业务。同时,该券商也积极推进虚拟化平台的演进,从最初的 VMware 逐步转向 SmartX 自主研发的 ELF 虚拟化平台,实现了技术自主可控。

构建一云多芯的私有云底座,全面拥抱信创

该券商积极响应国家信创战略,构建了一云多芯的私有云底座。大规模部署基于国产芯片和国产操作系统的信创集群,并逐步替换原有方案,实现了技术栈的收敛和统一管理。

此外,该券商还明确了向云原生架构全面转型的战略方向,并与 SmartX 成立联合创新实验室,在云原生存储、高性能计算、安全等方面进行深入合作,为未来的业务发展奠定了坚实的技术基础。例如通过 SR-IOV 和国密卡结合,提升交易安全性和性能。

 关键数据与亮点

  • 大规模部署:截至 2024 年底,该券商已部署多套集群,超过 1400 个节点,承载 20000+ 个虚拟机,是金融行业中大规模的超融合应用案例之一。
  • 全业务场景覆盖:应用场景涵盖 IDC、核心交易应用服务器、信创、云原生等多个领域,覆盖了 IT 基础设施的各个层面。
  • 异构环境管理:成功应对了 x86 和信创环境下多种服务器品牌和配置的异构问题,验证了 SmartX 超融合强大的硬件兼容性。
  • 一个平台集中管控:通过 CloudTower 管理平台对近千个节点进行集中管控,大大提升运维效率,降低了管理成本。

总结:超融合,正在成为核心系统的坚实基石

综上所述,超融合并非缺乏大规模、核心系统的实践案例,而是行业的技术探索、落地演进与现有认知的偏差造成的误区。以 SmartX 为代表的企业云平台,已在证券、银行、保险等金融行业核心系统中实现持续扩展与稳定运行,突破了传统架构在性能、扩展性和灵活性上的限制。

面对金融行业核心系统上云、信创替代、降本增效的多重需求,超融合以分布式架构为基础,具备高性能、高可用、强隔离、易扩展的能力,成为支撑企业未来数字化、云化转型的重要基石。

因此,超融合不仅能够胜任大规模、核心级系统的支撑任务,更将助力新一代金融 IT 架构的演进,推进企业在技术自主、安全合规、灵活敏捷之间实现最佳平衡。

【预告】超融合支撑不了核心应用系统与数据库?

尽管不少企业已实践超融合集群的大规模部署,但在与客户交流中,我们也常听到另一个流行的观点:“数据库用来存放我们最核心的业务数据,不敢把这些重要的生产数据库放在超融合上。”下一篇文章“常见误区解读之三:超融合只适合于外围及轻量业务场景,无法承载关键业务(如数据库)?”将深入探讨超融合架构在数据库场景的支持能力与性能表现,敬请关注!

欲了解更多 SmartX 超融合功能特性,欢迎下载《超融合技术原理与特性解析合集》三册电子书。

SmartX 超融合技术原理与特性解析合集(一)虚拟化与存储

SmartX 超融合技术原理与特性解析合集(二)管理与运维

SmartX 超融合技术原理与特性解析合集(三)全栈能力

继续阅读