传统架构经过 20-30 年的发展,用户对其在各种故障场景下性能和整体可靠性已经有了充分的了解。而对于超融合架构在各种故障场景下的整体表现,用户不甚了解。

SmartX 企业云平台以其自研的分布式存储和多项数据保护机制,确保在各类故障场景下的数据可靠性和性能稳定性,故障影响透明可控且恢复自动化。
1. 核心能力保障:
高可用 HA节点故障、存储网络故障或虚拟机异常时,自动将虚拟机迁移至健康节点并重启,保证业务连续性。
动态资源调度 DRS实时监控虚拟机 CPU、内存和存储资源使用情况,发现负载不均衡时生成迁移建议,可自动或手动迁移虚拟机,实现集群资源均衡。
2. 各类故障场景表现:
(1)磁盘故障:
分层模式:数据盘故障不影响性能;缓存盘故障会有短暂的性能波动,性能略有下降而后趋于稳定。
不分层模式:磁盘故障性能会有短暂的波动,而后趋于稳定。
(2)网络故障:
管理网络:节点管理网络整体故障不影响业务正常运行。
存储网络:单链路故障无影响;整体故障触发数据恢复 + 虚拟机 HA 迁移。
业务网络:单链路故障无影响;整体故障约 60 秒触发虚拟机热迁移。
3. 智能数据恢复在触发数据恢复的场景下,SmartX 企业云平台根据前端业务负载动态调速(低负载加速恢复,高负载保障业务优先)。
4. 集群意外整体断电:供电恢复后开机后,集群可自动恢复正常,虚拟机自动启动。

SmartX 与另一超融合厂商在硬盘故障前后性能对比

数据截取时间段:故障发生前 90 秒,总时长 31 分钟。性能抖动幅度越小、性能恢复比例越高,说明故障场景下的性能稳定性越好。

更多资料:SmartX 超融合硬盘健康检测机制升级(附故障模拟性能实测)

欲了解更多超融合常见误区解读,请阅读:

常见误区解读之一:超融合不是云,是过渡性产品和技术,不能满足建云需求?

常见误区解读之二:超融合不支持大规模部署,也没有落地案例?

常见误区解读之三:超融合只适合外围/轻量业务场景,无法承载数据库等关键业务?

常见误区解读之四:相较传统架构,超融合不够稳定?

常见误区解读之五:超融合耦合计算、存储和网络,增加运维复杂度,资源扩展不灵活?

常见误区解读之六:超融合不适合容器场景,性能也不如裸金属?

继续阅读