案例亮点

  • 基于 SmartX 企业云基础设施构建数据中心双活集群,提升 IT 基础架构可用性的同时,避免原“vSphere+全闪集中式存储”架构双活建设中的技术与成本挑战。
  • 替代 VMware 虚拟化承载核心数据库,性能提升约 18% 且总体投入成本降低约 30%,真正落实“降本增效”。
  • 采用 Everoute 微分段防火墙模块提供虚拟化环境“东-西向”安全防护能力,增强数据中心网络安全。

全产业链布局背景下的 IT 共享架构:高效率与挑战并存

在全球玻璃制造领域,信义玻璃控股有限公司(以下简称“信义玻璃”)始终以创新者的姿态引领行业发展。作为一家深耕玻璃制造 30 余年的行业翘楚,公司产品矩阵覆盖浮法玻璃、汽车玻璃、建筑玻璃和光伏玻璃等重要类别,通过旗下信义光能、信义储电、信义易车、信义能源等上市平台,构建起了完整的产业生态版图。在集团化运营模式下,信义玻璃多个上市子公司共享核心 IT 资源,实现业务高效协同。但与此同时,这种管理模式也对集团 IT 基础设施的可靠性和安全性提出了更高的要求:

  • 极致可用性要求:OA、CRM、ERP 等核心业务系统的容错时间不可超过 15 分钟,这是保障集团化运营背景下,各上市公司业务顺利开展的关键指标。
  • 风险防控需求:一次意外的机房断电事故造成的重大影响,让信义深刻认识到基础设施灾备的重要性,针对基础架构建设,需要充分考虑不可抗力等因素造成的数据中心级别的故障影响,并具备可靠可用的故障恢复方案。

原有基础设施布局:多数据中心混合云架构

基于以上基础设施可靠性需求,在数字化转型的浪潮下,信义玻璃选择了一条融合创新之路,打造了富有特色的混合云架构:

  • 公有云:战略性选择某国产公有云平台承载数据治理业务,以灵活的公有云服务降低私有化部署的成本压力。
  • 私有云:
    • 某国产公有云私有化部署环境:承载应用服务与部分非核心数据库。
    • VMware 平台:采用 vSphere+Dorado 全闪存储的架构,是支持核心数据库业务的主要运行平台。

信义玻璃的数据中心规划充分体现了”稳健与创新”的战略思维:基于国产公有云私有化部署方案,构建了移动托管 IDC 和研发中心 IDC 的双数据中心架构,两个中心的基础架构均按照 1:1 等比建设,实现数据层面的冗余性保障。

高可用挑战:数据中心双活落地的技术与成本瓶颈

当前架构已经实现了一定程度的数据冗余,但在核心数据库层面仍不满足业务可用性的关键指标,若在现有架构上实施双活改造,将面临技术路线选择与投资成本的双重压力:

  • 国产公有云私有化部署方案的局限性:
    • 在核心数据库场景下,国产公有云私有化部署方案配合集中式存储的性能表现未能满足业务预期,不能满足高并发、高压力场景下的实际需求。
    • 后期维护成本高,尤其体现在跨数据中心双活场景下,因为该技术栈要求数据中心间的存储容量进行等比扩容。
  • vSphere+集中式存储方案的经济性与技术可行性矛盾:
    • 从技术可行性来看,基于 vSphere 与集中式存储的双活方案经过客户验证,可以满足性能需求。但从经济性来看,跨数据中心建设需要大规模硬件投入,硬件成本居高不下。其中,FC 交换机单台成本较普通以太网交换机高出十余万元,而存储同步需配置多台 FC 交换机,跨数据中心部署则需配置 4 台以上 FC 交换机。另外,集中式存储成本也较高,单位容量价格是分布式存储的 3-5 倍。
    • 此外,VMware 转向订阅制后,许可证费用持续攀升。尽管 vSAN 延伸集群方案可降低硬件依赖,但整体 TCO 仍高于基于通用 x86 服务器的软件定义存储方案。
  • 智能制造转型中的架构挑战:随着信义集团向智能制造转型,集团多个下属分支工厂未来会有无人智慧工厂的建设需求,需要与数据中心基础架构具备一致性,以降低管理和运维难度。而传统三层架构的起步规模较大,投入成本高、运维复杂,不适合工厂应用场景。

SmartX 企业云基础设施:以更低的 TCO 实现跨数据中心业务双活,打造高可用 IT 基础架构

经过充分的调研论证,辅以严苛的基于实际环境的压力测试,信义玻璃最终选择采用 SmartX 企业云基础设施方案构建数据中心双活集群,最终以更低的投资成本,建设了完全满足需求的高可用 IT 基础架构。

方案解读

构建“3+3+1”双活集群,承载集团核心共享业务数据库

信义玻璃在研发中心和移动机房分别部署 3 节点 SmartX 企业云基础设施(ELF)集群,以公有云虚拟机作为仲裁节点,形成了 3+3+1 节点的双活集群架构,支撑 HR、财务、OA 应用系统对应的数据库,实现数据库双活容灾。

方案特点 1:跨数据中心的数据安全保障

双活集群会将每个数据块在优先可用域(研发中心)保存 2 个副本,次级可用域(移动机房)保存 1 个副本,总体构成 3 副本,能够在各类故障场景下保证数据安全性。

方案特点2:跨数据中心的分钟级业务可用性保障

双活集群中,当优先可用域(研发中心)的单个物理节点故障时,虚拟机会正常触发 HA,并且虚拟机 HA 目的地为优先可用域上的其他节点,避免跨站点的业务迁移导致网络配置变更。当出现整个数据中心级别的故障时,业务能实现跨数据中心迁移,虚拟机实测可在 3 分钟内重新启动。

方案特点3:直接复用现有网络架构

SMTX OS 双活集群搭建存在最低建设网络要求标准(如下),信义现有的网络环境能较好满足该标准,无需更改网络硬件配置。

  • 可用域之间的存储网络带宽不低于 10 Gbps,仲裁节点与优先/次级可用域的存储网络之间的带宽应不低于 1 Gbps。如果管理网络和存储网络使用网络融合部署模式,即两个网络共用同一个网口,则网络带宽必须不低于 10 Gbps。
  • 集群内优先可用域与次级可用域之间的存储网络 ping 延迟在 5 ms 以下。仲裁节点与优先可用域或次级可用域之间的存储网络 ping 延迟在 100 ms 以下。

在硬件配置上,方案采用第三方硬件服务器,集群采用全 NVMe 配置保障双活数据库性能,服务器集群跨数据中心实现 3+3 组合。其中,仲裁节点放在原有的数据治理公有云平台上,通过云主机的方式提供服务。

双活集群单台硬件服务器配置:

替换 VMware 集群,3节点承载非共享业务数据库

信义玻璃还以 SmartX 企业云基础设施整体接替原先承载非双活业务数据库的“vSphere+全闪集中式存储”架构,支持资金管理、TSM 等应用系统数据库,帮助用户实现 VMware 虚拟化成本节约。

在硬件方案,方案采用第三方硬件服务器,由 3 台服务器构成集群,采用全 SATA SSD 配置,满足性能需求。

用户收益

SmartX 企业云基础设施在满足信义玻璃跨数据中心双活建设需求的同时,还带来了多个方面的显著收益:

  • 广泛的硬件兼容性降低采购成本:SmartX 支持多样化的第三方硬件选型,最大限度扩展了采购选择空间。此次项目中,SmartX 全面支持第三方 Intel 第 4 代处理器机型,让客户以较低的投入获得当前市场主流一体机(采用新一代 CPU)的同等性能,满足业务性能需求的同时,有效降低整体采购成本。
  • 硬件最小化改动实现双活建设:网络硬件层面,SmartX 企业云基础设施无需对现有网络架构进行大规模改造,在信义数据中心现有网络架构下,仅需增加 4 台万兆交换机即可完成架构升级,无需过多变更。双活实现上,使用通用x86服务器+软件定义方式实现,无需专有硬件,极大降低方案复杂度。
  • 业务效率的提升:经过实测,相较于原有 VMware+全闪集中式存储架构,SmartX 企业云基础设施进一步提升了核心数据库的性能,核心数据库实测 Swingbench 平均 TPS 性能提升18%,且总体投入成本降低约 30%。
  • 卓越的业务可用性保障:经过全面的测试,SmartX 双活集群在数据中心级别故障情况下,业务虚拟机可在 3 分钟内实现自动故障转移,有效满足了业务可用性需求。
  • 全面的网络安全防护:SmartX 企业云基础设施通过 Everoute 针对虚拟化环境安全风险提供了专门防护,提供高效的“东-西向”流量安全防护能力,弥补了传统硬件方案无法覆盖的虚拟化安全盲区,其易用性和高效性极大提升了数据中心的“东-西向”安全。

总体而言,SmartX 企业云基础设施的成功部署,不仅帮助信义玻璃完美实现了高可用 IT 基础架构的全新升级,更在成本效益、安全防护和运维管理等方面实现了大幅提升,为企业数字化转型注入了强劲动力。更多制造企业 IT 基础设施建设与转型实践,欢迎下载 《SmartX 超融合容灾备份解决方案》 电子书!

推荐阅读:

继续阅读