传统架构经过 20-30 年的发展,用户对其在各种故障场景下性能和整体可靠性已经有了充分的了解。而对于超融合架构在各种故障场景下的整体表现,用户不甚了解。
SmartX 企业云平台以其自研的分布式存储和多项数据保护机制,确保在各类故障场景下的数据可靠性和性能稳定性,故障影响透明可控且恢复自动化。
1. 核心能力保障:
–高可用 HA:节点故障、存储网络故障或虚拟机异常时,自动将虚拟机迁移至健康节点并重启,保证业务连续性。
–动态资源调度 DRS:实时监控虚拟机 CPU、内存和存储资源使用情况,发现负载不均衡时生成迁移建议,可自动或手动迁移虚拟机,实现集群资源均衡。
2. 各类故障场景表现:
(1)磁盘故障:
–分层模式:数据盘故障不影响性能;缓存盘故障会有短暂的性能波动,性能略有下降而后趋于稳定。
–不分层模式:磁盘故障性能会有短暂的波动,而后趋于稳定。
(2)网络故障:
–管理网络:节点管理网络整体故障不影响业务正常运行。
–存储网络:单链路故障无影响;整体故障触发数据恢复 + 虚拟机 HA 迁移。
–业务网络:单链路故障无影响;整体故障约 60 秒触发虚拟机热迁移。
3. 智能数据恢复:在触发数据恢复的场景下,SmartX 企业云平台根据前端业务负载动态调速(低负载加速恢复,高负载保障业务优先)。
4. 集群意外整体断电:供电恢复后开机后,集群可自动恢复正常,虚拟机自动启动。

数据截取时间段:故障发生前 90 秒,总时长 31 分钟。性能抖动幅度越小、性能恢复比例越高,说明故障场景下的性能稳定性越好。
更多资料:SmartX 超融合硬盘健康检测机制升级(附故障模拟性能实测)。
欲了解更多超融合常见误区解读,请阅读:
常见误区解读之一:超融合不是云,是过渡性产品和技术,不能满足建云需求?
常见误区解读之三:超融合只适合外围/轻量业务场景,无法承载数据库等关键业务?