作者:深耕行业的 SmartX 金融团队

背景介绍

某银行自 2019 年开始引入 SmartX 超融合基础架构平台(文章后续将用 HCI 代替超融合架构),用于支撑开发测试 / 同城灾备 / 桌面虚拟化 / 辅助生产系统的新一代计算存储资源池构建,到目前为止,交付的 4 个集群运行稳定。

经过多次交流和讨论,用户计划将年终决算跑批验证相关系统迁移至 SmartX HCI 平台,通过实际业务场景和数据量,在验证 SmartX HCI 性能表现的同时,评估并探索 HCI 对于银行更多业务场景适用性。

跑批验证:为了保证生产环境年终决算当日的跑批顺利完成,需提前对业务系统进行模拟跑批,验证跑批应用逻辑,并优化逻辑的过程,降低生产跑批可能遇到的风险,同时验证跑批的时效性也是非常重要的评估指标。

用户实际生产环境

银行核心1.png

  • 总账 / 营销 / 新会计财务应用系统 & 数据库采用虚拟化结合集中存储部署架构。
  • CBS / CMS 应用系统采用虚拟化底层架构,数据库运行在小机平台,使用集中存储提供数据持久化。

SmartX HCI 验证环境配置

银行核心2.jpg

软件组件:

  • SMTX OS 5.0(HCI 系统)
  • VMware ESXi 6.7u3(Hypervisor)

集群存储网络(用于分布式存储数据同步):

  • 以太网 25GbE 网络
  • 启用 RDMA

跑批验证系统清单

本次跑批验证迁移 5 套系统:

  • 系统 1:总账系统
  • 系统 2:CBS 信贷系统(Core Banking System)
  • 系统 3:CMS 核心系统(Credit Management System)
  • 系统 4:营销系统
  • 系统 5:新会计计量准则

在 3 台 SmartX HCI 测试机上,迁移 & 新建虚拟机共 18 台,包括 4 套 Oracle 数据库,1 套 MySQL 数据库,存储使用率达 96.6%(高负载状态,二副本数据保护),由于 SmartX HCI 平台 CPU 和 MEM 资源有限,CBS 和 CMS 系统数据库初始资源配置未能做到与生产系统配置一致。

银行核心3.jpg

性能验证

介绍完上述背景和环境信息后,下面我们一起看一下整个验证过程,首先在未对数据库虚拟机资源进行优化的背景下,进行了第一轮跑批测试,与生产环境对比如下:

第一轮验证

表格1.png

通过第一轮测试,除 CMS 信贷和 CBS 核心系统外,其余系统跑批性能结果与生产环境相当。首先针对 CBS 核心系统进行分析,监控分析跑批时间段内 HCI 平台主机和虚拟机的性能压力,初步判断与虚拟机的资源配置有关,原因是本次测试环境只有 3 台主机,计算资源平均分配给 18 个业务虚机使用,使得分配给数据库的资源较少,与生产环境资源配置差距很大。有了优化目标后,对 CBS 核心系统资源进行调整优化。

CBS 核心系统数据库生产环境计算资源配置:

  • Power8 4.02GHz 64 Core
  • 1T MEM

SmartX HCI 平台 CBS 核心数据库优化:

  • 8 vCPU 调整优化 28 vCPU
  • 32G MEM 调整优化 192G MEM
  • 按数据库最佳实践对 Guest OS 和 Oracle 进行了基础优化
  • 将 Oracle SGA、PGA、Redo 调整至与生产环境一致

当前集群整体存储容量使用率达 77.8%(二副本数据保护,在较高负载下,进行新一轮性能测试,验证应用性能表现及稳定性)。

第二轮验证

表格2.png

优化后的 CBS 核心系统数据库跑批性能表现出近 1 倍时间缩短,为了保证与生产环境配置尽可能一致,我们对测试库开启了归档,进一步验证 SmartX HCI 平台对数据库平台的高性能支撑能力。

Oracle AWR 生产环境与 SmartX HCI 对比

生产环境下 CBS 数据库等待事件

银行核心4.jpg

SmartX HCI 平台 CBS 数据库等待事件

银行核心5.jpg

通过 AWR 报告,SmartX HCI 相比用户生产环境在 I/O 相关等待次数和等待时间大幅减少。

CMS 信贷系统的性能问题与 CBS 核心系统数据库相似,在第二轮验证过程中,未进行 CMS 系统的优化,优化重心全部倾向于 CBS 系统。

总体跑批测试对比结果如下:

银行核心6.jpg

总结

通过 SmartX HCI 测试环境(仅 3 台 PC 服务器)表现出的跑批性能与生产环境相当,CBS 核心系统相比生产环境跑批时间缩短 45%,效率提升 83.6%。

借助超融合敏捷的基础架构,集群快速交付,业务系统快速部署,顺利完成行方跑批结算验证任务。

通过本次业务性能验证,超融合的架构简单、弹性资源、高性能、易维护性和经济成本优势得到充分体现,剩下的事情,就是不断拓宽超融合的应用场景,用时间来验证超融合产品的稳定性、产品迭代更多的企业级功能和厂商的服务效率。

点击下载 SmartX 金融核心生产业务场景探索文章合集,了解多个金融行业应用场景在原生产环境平台与超融合基础架构上的运行状况对比。