分支工厂 IT 基础设施的现状与挑战
大中型制造业企业往往需要数个分布在不同城市甚至不同国家的工厂来完成制造任务,其中 MES 等制造业信息化系统作为驱动现代化制造的“大脑”已成为分支工厂的标配。然而,确保这些业务系统始终稳定运行并非易事。尤其是提供计算、存储和网络通信能力的 IT 基础设施,作为支持业务高效稳定运行的关键底座,一旦出现问题或将直接导致停机停产,给工厂业务带来重大损失。因此, IT 基础设施的建设和运维是整个分支工厂 IT 系统的重点。
然而,不同于总部的数据中心,分支工厂难以具备专业的运维团队和较快的问题处理速度,且由于分布分散、业务差异大,分支工厂在 IT 基础架构的运维管理上容易出现人手不足、专业技术匮乏、运维效率低、故障不能及时处理等问题。
同时,分支工厂的 IT 基础架构多采用“服务器(虚拟化)+ SAN 网络 + 独立 SAN 存储”的传统三层架构,这种架构为分支工厂的基础设施运维管理带来了更多挑战:
- 运维复杂:传统架构结构复杂,且运维中(如遇到硬盘和节点故障)涉及多项手动操作,运维难度大、风险高、时间长。
- 管理效率低:缺乏统一管理的工具和平台,需要运行多窗口对各工厂分别进行管理。
- 构建成本高:不仅需要购买存储硬件、专用的交换机和虚拟化软件,还需要占用较多机房空间。
制造业传统三层架构
SmartX 超融合基础设施如何解决这些挑战
针对上述问题,SmartX 面向制造业分支工厂提供超融合基础设施解决方案,即采用“通用的商用服务器或 SMTX Halo 超融合一体机 + SMTX OS 超融合核心软件(包括分布式块存储软件 ZBS、原生虚拟化 ELF 等)+ 标准的以太网交换机”替代传统架构,精简了基础架构层级,并大幅降低了系统的运维难度。
传统虚拟化架构与超融合架构对比
基于创新的架构和 SmartX 超融合基础设施“4 大关键能力”——按需投资与快速交付、支持多种虚拟化与服务器、承载关键业务应用、零业务中断的智能运维——SmartX 超融合整体方案在分支工厂场景下具备如下优势和价值。
可承载包括核心业务在内的各类生产业务
SmartX 超融合以自主研发的分布式存储为核心,通过端到端的性能优化提升与多级别的数据保障,为分支工厂提供具备生产级高可靠高可用特性的基础架构,支持多地区工厂稳定开展包括核心业务在内的各类生产业务。
其中,SmartX 超融合自带多种数据保护和高可用机制,有效保证工厂核心业务连续性。
- 多副本机制不仅可以在服务器硬件故障时确保数据冗余不丢失、数据访问不中断,还可以利用已有空间自动完成数据的副本恢复,将数据恢复至正常状态。
- 虚拟机 HA 可为关键业务虚拟机开启“高可用”保护,当主机故障时,3 分钟内即可自动恢复业务,整个过程无需人工干预。
- 快照计划可根据用户设定的执行周期自动为虚拟机制作快照,在需要时快速恢复虚拟机,避免逻辑灾难。
- 对于有更高级别高可用需求的工厂,SmartX 可提供双活集群和跨站点异步复制等容灾方案,在发生机房等级别的故障时,仍可保障核心生产无中断。
目前,SmartX 超融合基础设施的生产级高可用特性已经过金融、制造等行业客户生产环境的长期检验,可承载包括核心业务在内的各种业务系统和数据库。在制造行业,众多企业也已采用 SmartX 超融合支持分支工厂的 MES、ERP、仓储系统、PLM 系统、CRM 系统等关键业务系统。
零中断的简单智能运维大幅降低运维难度
传统架构中,服务器、SAN 网络、虚拟化和存储需要分开管理,运维复杂,耗时耗力,且管理风险较高。SmartX 超融合以精简的架构和智能化管理简化运维操作,大幅降低运维难度,帮助 IT 人员高效管理偏远工厂,降低管理成本。
- 扩容与软硬件升级“0”业务停机:SmartX 超融合架构支持软件一键升级功能,并可通过异构扩容和数据迁移实现硬件平滑升级,整个过程不停机,且几乎不涉及手动操作。
- 故障恢复与扩容空间均衡“0”人工干预:单节点故障后可自动恢复数据,并根据智能化的数据恢复与均衡算法自动平衡业务与数据恢复 I/O。同时,节点扩容后可自动均衡数据分布。
- 资源优化与日志采集等操作“1”键完成:虚拟机资源优化、日志采集等日常运维功能均可一键操作,大幅简化运维流程。
- 管理多集群与多数据中心仅需“1”套界面:统一视图界面实现集中管理,所有基础架构资源和状态一目了然,方便运维人员远程管理多厂区基础架构与业务系统。用户可使用 SmartX 管理平台 CloudTower 对各分支工厂的超融合集群进行统一纳管,并对虚拟机进行跨集群迁移、安全访问设置等操作,以获得更好的隔离性、可扩展性和可维护性。
更低的采购成本和使用成本
相比于基于物理服务器的传统架构,超融合架构不需要独立的 SAN 交换机和独立的 SAN 存储,使得支持同样的业务所需的硬件数量不到传统架构(无虚拟化)的 1/6,机架空间节省 80% 以上,耗电量也大幅下降;即使是已经使用了服务器虚拟化的工厂,超融合也能节省掉独立的存储和服务器,提升机房的空间利用率超过 30%,同时降低机房在制冷、UPS 等方面的成本。
同时,如果用户采用 SmartX 原生虚拟化 ELF,还可节省 VMware 虚拟化采购成本。用户也可继续使用原有的 VMware 虚拟化授权,维持使用习惯。
软硬件解耦特性支持硬件资源灵活配置
超融合软硬件解耦的特性支持用户根据各厂区需要选择合适的硬件资源,避免厂商锁定的情况。SmartX 超融合适配多家主流品牌服务器、CPU 等硬件设备,并支持以 SMTX Halo 超融合一体机或软件的形式进行交付,为各地工厂提供更加灵活的基础架构建设选择。
案例解读
案例一
某集团旗下有多个钢铁工厂,分布在全国各地,这些工厂不仅在地域上分布松散、偏远,而且缺乏专业的管理员执行运维工作——常驻运维人员少,且由于出差成本高,临时的运维人员也非常稀缺。同时,由于企业采用传统模式构建分支机构数据中心,面临硬件设备种类繁多、配置不灵活、架构复杂、性价比低等挑战。为了解决以上问题,该企业希望引进相较于传统架构更为简单、性能稳定、可承载分支工厂全部业务的新型架构。
经过产品评估和验证,该企业选择 SmartX 超融合作为部分地区新建工厂基础架构。在实际部署过程中,该企业选择软件交付的方式,可在多品牌服务器上部署。在服务硬件到位后,超融合系统在一周时间内部署上线完成,满足了新建工厂快速构建 IT 系统、业务上线的需求。
目前,该企业已在全国 5 个分支工厂部署 SmartX 超融合产品,每个工厂 4-6 个节点,承载包括 ERP、MES、工业网、设备管理、综合管理在内的全部生产业务,支持各分支工厂关键产线的稳定运行。
在运维方面,该企业位于总部的运维团队可以通过管理平台实现各地工厂的统一运维与管理;与此同时,为保障各地工厂的稳定运行,SmartX 售后工程师每周都会前往总部,针对各工厂的运行情况进行巡检,帮助分支工厂解决了运维统一性和专业性的问题。
案例二
某国际知名电子科技制造服务商计划使用私有云替代传统虚拟化架构,支持全球各分公司的信息化系统。同时,为保证生产安全,分公司的产线业务系统的基础架构必须做到严格的内网隔离,为内网的产线系统单独部署一套独立的基础架构,运行 MES、SAP、产线综合管理系统等产线业务系统。
目前基于其自主维护的 OpenStack + Ceph 的私有云方案(以下简称“原私有云方案”)架构复杂,实际部署过程中起步需要超过 20 个节点;而建设生产内网系统不仅构建成本高,也增加了运维的复杂性。
通过沟通,用户了解到 SmartX 超融合不仅架构精简、运维简单、弹性好,同时对双活和 Oracle RAC 有良好的支持能力,并已在业内具备诸多承载关键生产业务的案例,非常符合产线 IT 基础架构建设需求,于是决定进行产品 POC 评测。
历经超过半年的 POC 环节,SmartX 超融合在功能、稳定性等方面均满足了用户的要求,用户尤其满意 SmartX 超融合基于更精简的架构、更少的硬件却带来了更高的性能。用户基于同样的单节点配置对比了 7 节点原私有云方案和 3 节点 SmartX 超融合集群的性能,结果显示,在服务器节点减少超过一半的情况下,SmartX 超融合仍在 IOPS 和时延方面优于用户原私有云方案,远超出用户的预期。POC 的具体情况见下图。
目前,用户已采用 SmartX 超融合在中国和东南亚在内的 5 个分公司部署了 40 个超融合节点,除了承载各分公司生产内网的 MES、ERP、产线综合管理等业务系统和其中一家分公司的开发测试业务,东南亚工厂还将在未来直接使用 SmartX 超融合完全替代原私有云方案,承载该工厂所有业务。此外,各工厂后续计划基于 SmartX 超融合平台建设双活拉伸集群,承载核心生产业务的 Oracle RAC 数据库。
SmartX 超融合支持各地分公司核心业务系统
除了极致的性能与可靠性,SmartX 超融合基础架构还为用户带来如下价值:
- 降低采购与使用成本:所有超融合集群均采用 SmartX 超融合免费的原生虚拟化 ELF,在提供高可靠高可用特性的同时降低用户采购成本。
- 灵活配置:采用超融合软件交付的方式,用户可自行选择最有性价比的 x86 服务器硬件。
- 高效运维与统一管理:系统上线快、运维简单,用户也可在未来使用 CloudTower 对各地超融合集群进行统一的可视化管理。
点击了解更多 SmartX 行业客户超融合部署实战。