论坛问题精选:

超融合断电情况下,如何保证业务高可用?

回复:

SmartX 提供从硬盘到跨城市的生产级高可用特性。

首先会通过机架感知等策略,尽可能的避免断电现象的出现,一旦出现断电等导致节点级故障,会自动触发 HA ( 高可用 ) 将业务迁移到集群内其他节点。详细策略如下:
container_stores_6.png

  • 多副本:同一份数据会保存多份(通常设置为 2 副本或 3 副本),即使副本所在的节点宕机也不会造成数据丢失;
  • HA(高可用):节点宕机时,该节点上的虚拟机自动迁移至集群内其它节点,降低业务中断时间;
  • 快照:为虚拟机打快照,在其发生故障时将数据恢复至快照状态;
  • 机架感知:根据机房物理拓扑结构,将副本分配在不同的机架、机箱、主机上,有效减少甚至避免物理硬件(电源、交换机等)故障导致的数据丢失。理论上,3 副本结合机架感知配置,系统可最多容忍 2 个机架上的主机全部失效;
  • 双活:同城双数据中心,灾难时无损快速恢复业务(RPO=0);
  • 备份:异地主备数据中心,灾难时尽可能挽回数据损失。