灾备方案建设要点
由于金融行业具有信息化程度高、安全性要求高的“双高”特点,财达证券在对恢复指标要求、技术成熟可靠、成本效益高等方面综合考量后,决定采用同城双活架构实现跨站点集群数据保护和容灾。双活数据中心解决了传统数据中心单一“主备”模式资源利用率低、可用性差、故障停机时间长、数据恢复慢等弊端。基于此,财达证券制定了如下项目目标:
- 实现灾备系统的 RPO=0:存储层实现 IO 实时同步复制,即使单一机房发生严重灾难,依然可以保障数据可靠性,数据不丢失。
- 实现业务持续性保障:支持虚拟机的跨站点级别高可用,即使发生站点级别故障,系统可以最短时间自动切换至正常站点 并恢复虚拟机运行。
- 支撑应用层双活:双活集群可配合数据库/应用服务器集群功能,实现应用层面的透明故障切换。
验证超融合双活架构功能
超融合双活集群以拉伸形态部署,由两个可用域和一个仲裁节点组成。两个可用域与仲裁节点间通过网络连接通信。当一个可用域失效后,另一个可用域仍可以继续提供服务,从而获得可用域级别的容灾能力。
财达证券模拟了主机故障、任意可用域(数据中心)故障、网络故障等多种故障场景,测试结果表明超融合双活集群都可以即刻进行风险规避处置策略,对于单体架构业务系统,可以在 2-3 分钟内恢复业务,结合 Oracle RAC 数据库多活架构,可以实现 RPO 和 RTO 均为零的容灾目标。
国产超融合平台双活集群建设方案
财达证券目前中华商务为主数据中心,运行财达核心业务系统,开发区电信机房为灾备数据中心,承载主数据中心中华商务的灾难职能,庄家金融大厦数据中心运行少量管理类业务。主备机房间物理距离约为 20km ,网络往返延迟(基于 ping 测试)稳定在 0.6 ms。
通过当前各数据中心功能定位,规划将开发区电信机房和中华商务分别定位优先和次级可用域,庄家机房设定为仲裁站点,通过 SmartX 延伸集群技术,结合财达当前大二层双活网络能力,实现双活数据中心的构建。
助力业务连续性与运维升级
超融合双活集群为业务连续性提供了坚实“底座”,财达证券将由于 资源紧张等原因未在灾备机房建设灾备的业务系统迁移到双活集群,提升了该部分系统的应急灾备级别,后续也无需再为双活集群上的系统建设灾备系统,降低了 IT 投入成本。
目前财达证券生产、灾备系统的应急切换采用自动化流程结合手工方式,避免了过去纯手工方式带来的运维量和复杂度,提高了业务连续性与合规性。
SmartX 超融合技术原理与特性解析合集(三)全栈能力
深入解读容 器管理与服务、网络与安全、备份与容灾相关技术原理与特性。
SmartX 超融合技术原理与特性解析合集(二)管理与运维
深入解读磁盘亚健康检测、存储性能管理、升级、扩容、迁移等关键技术与特性。
SmartX 超融合技术原理与特性解析合集(一)虚拟化与存储
深入解读快照、缓存、I/O 路径等关键技术与特性,包含与 VMware 和 Nutanix 的详细对比。
超融合常见误区解读
解读超融合建云、大规模部署、承载核心应用、运维与扩容、容器支持等 30+误区。
信创云转型合集:技术路线、厂商评估与用户实践
一站式了解信创云转型中各类选型问题。
SmartX 金融核心生产业务场景探索文章合集
整理了多个金融行业应用场景在原生产环境平台与超融合基础架构上的运行状况对比。


