SMTX 备份与容灾包含两个功能模块——备份与恢复、复制与恢复。本文将介绍部署备份与恢复模块前的规划工作。

copy-1.png

备份与复制模块的关键组件包含:

  • 备份服务:核心组件,备份的控制平面。
  • 备份存储库:用于存储虚拟机备份文件的逻辑存储库,如 NAS 服务器。
  • 备份计划:定义一组虚拟机的备份策略,包括备份服务、备份存储库、备份对象、备份周期、备份窗口、恢复点保留策略。
  • 虚拟机:待保护虚拟机。
  • 集群:待保护虚拟机所在集群。

在部署备份服务前,请根据数据中心实际的环境和业务需求,从以下几方面进行规划。

规划需部署的备份服务

备份服务是备份与恢复的核心组件,可以为 SMTX OS(ELF)集群中的虚拟机制定周期性的备份计划,将虚拟机备份至集群外部的备份存储库中,并可使用备份文件将虚拟机恢复至备份时的状态。

在部署备份服务之前,请根据数据中心、集群和 CloudTower 的实际情况,确认需部署的备份服务数量。

  • 是否需跨数据中心
    由于跨数据中心的网络易发生传输不稳定的问题,建议为每个数据中心分别部署备份服务,并将虚拟机备份至位于同一个数据中心的一个或多个备份存储库中,保障备份和恢复的稳定性和传输效率。
  • 待备份的多个集群是否互相连通
    若需备份多个集群,请确认集群之间的存储网络是否连通,并据此规划需部署的备份服务数量。
    • 若集群之间的存储网络连通,部署一个备份服务即可对多个集群进行备份和恢复。
    • 若集群之间的存储网络不连通,则需为每个集群单独部署一个备份服务。

copy-2.png


说明: 一个备份服务仅可以部署在一个 SMTX OS 集群中,但一个 SMTX OS 集群可以部署多个备份服务。

  • 是否使用多个 CloudTower 管理
    由于备份服务需通过 CloudTower 进行部署和关联操作,对于未被同一个 CloudTower 管理的集群,备份服务无法为其进行备份。因此,若使用了多个 CloudTower 管理集群,那么每个 CloudTower 中都需部署备份服务,且使用单独的许可。

规划备份计划

备份服务使用备份计划来管理备份策略。备份计划定义了备份服务、备份对象、备份存储库、备份周期和恢复点保留策略等。在创建备份计划前,请从以下几个方面规划备份计划:

  • 备份对象
    每个备份计划中可包含一个或多个虚拟机,这些虚拟机共享相同的备份策略。因此,建议根据不同的数据保护要求,对虚拟机进行分类,将具有相同备份周期、备份窗口和保留策略的虚拟机置于同一个备份计划中,避免重复定义相同的备份策略,提高运维和管理效率。
    说明:
    不支持备份以下虚拟机:
    • 挂载了共享虚拟卷的虚拟机。
    • 运行系统服务的虚拟机,如 Everoute Controller 虚拟机、CloudTower 虚拟机、备份服务虚拟机、复制服务虚拟机、可观测虚拟机、高级监控虚拟机等。
    • SKS 工作负载集群节点虚拟机。
    • 处于操作中或未知状态的虚拟机。
    • 所在集群的许可类型为试用许可且许可已过期的虚拟机。
  • 备份类型
    备份类型包括全量备份和增量备份,且在首次备份时会执行全量备份。用户可以采取全量备份和增量备份的组合,创建最符合实际需求的备份策略。
    • 全量备份:在执行备份的时间点对虚拟机的所有数据进行完全拷贝。
    • 增量备份:在上一次备份(全量备份或增量备份)的基础上,备份所有发生变化的数据。
  • 备份周期
    通过设定备份周期,备份服务可以对虚拟机自动化进行周期性的备份。用户可以根据业务系统的 RPO(Recovery Point Objective)目标,正确设置数据备份的时间间隔。备份支持的最小 RPO 为 15 分钟,因此可根据业务需求合理选择备份周期,以确保数据的及时备份和恢复能力。
  • 恢复点保留策略
    每次执行完备份计划后,备份服务会为备份计划中的每个虚拟机创建一个恢复点,恢复点包含了备份时间点的所有虚拟机数据,在需要时,可通过恢复点将虚拟机恢复至备份时间点的状态。
    恢复点保留策略可以定义保留的恢复点数量或时间范围,当备份数据不需要长期保存时,可通过恢复点保留策略控制备份存储库中的恢复点数量。

规划备份存储库容量

备份存储库是用于存储虚拟机备份文件的逻辑存储库,如 NAS 服务器。

请根据虚拟机的数量、分配的逻辑容量、当前使用容量、每天实际变化的数据量等信息,并结合虚拟机的备份周期和恢复点保留策略,预估当前容量情况和容量增长趋势,规划备份存储库的容量需求。

以一台 VM 为例:

采集信息 计算 说明
1. VM 的容量为__GiB?  全量备份所需容量  = VM 容量 / 压缩比
  • VM 容量可根据已使用容量或 Guest OS 中存储使用量计算
  • 压缩比通常在 1.5 ~ 2 
2. 每次增量备份的容量变化率是多少? 增量备份所需容量  = VM 容量 * 变化率 / 压缩比 预估虚拟机容量变化情况
3. 备份周期是什么?全量备份周期是什么? 每条备份链所需容量= 全量备份所需容量 * 1 + 增量备份所需容量 * 两次全量备份之间的增量备份数量 一条备份链包括一个全量恢复点及依赖它的一系列增量恢复点
4. 恢复点保留策略是什么?(保留__天或保留__份)
  • 要保留的备份链数
    • 按天数保留:= ceil (保留天数/全量备份周期)
    • 按份数保留:= ceil (保留份数/每条备份链的恢复点个数)
  • 备份存储库所需总容量 = 每条备份链所需容量 * (备份链数量 + 1) * 1.2
  • ceil ( ) 为向上取整
  • 备份链数量 + 1 :因自动删除恢复点会删除一整条备份链,实际可能会多保留一条备份链
  • 1.2 为经验系数,因计算过程中使用的 VM 容量、压缩比、容量变化率均为估值,并且用户可以手动执行备份计划生成恢复点,因此在计算总容量时预留一部分容量,以防因备份存储库容量不够导致备份失败
  • 在实际使用过程中,需要根据备份存储库的容量使用情况按需扩容

采集信息 计算 备注
1. VM 已使用容量 150GiB 全量备份所需容量  = VM 已使用容量 / 压缩比 = 150 / 1.5 = 100GiB
  • VM 容量按照已使用容量计算
  • 压缩比按 1.5 计算
2. 每天的容量变化率 10% 增量备份所需容量 = VM 已使用容量 * 变化率 / 压缩比 = 150 * 10% / 1.5 = 10GiB
  • 虚拟机每天容量变化率按 10% 计算
  • 压缩比按 1.5 计算
3. 备份周期 1 天,全量备份周期 7 天 每条备份链所需容量 = 全量备份所需容量 * 1 + 增量备份所需容量 * 两次全量备份之间的增量备份数量 = 100 * 1 + 10 * 6 = 160GiB  
4. 恢复点保留策略保留 14 天
  • 要保留的备份链数量(按天数保留)= 保留天数/全量备份周期

= 14 / 7 = 2

  • 备份存储库所需总容量 = 每条备份链所需容量 *(备份链数量 + 1)* 1.2

= 160GiB *(2 + 1)* 1.2 = 576GiB

 

规划网络

备份服务以虚拟机的形式在集群中运行,为了保证备份和恢复功能的正常进行,运行备份服务的虚拟机需创建管理网络、存储网络和备份网络,并分别和 CloudTower、待保护的虚拟机以及备份存储库建立网络连接。

  • 管理网络:和 CloudTower 连通,用于管理备份资源。
  • 存储网络:和待保护的虚拟机所在的 SMTX OS 集群的存储网络连通,用于备份时读取虚拟机数据和恢复时写入虚拟机数据。
  • 备份网络:和备份存储库连通,用于传输虚拟机数据。

以一个数据中心、一个 SMTX OS 集群,且备份存储库和存储网络连通的场景为例,备份基础架构的网络拓扑如下图所示。

copy-3.png

为保证备份流程的正常进行,在部署备份服务之前,需对备份服务的网络进行规划。

  • 规划备份服务的管理网络
    备份服务的管理网络需连通 CloudTower。
    部署备份服务时,需为运行备份服务的虚拟机创建管理网卡,并确保备份服务可通过选择的虚拟机网络与 CloudTower 连通。
  • 规划备份服务的存储网络
    备份服务的存储网络需连通集群的存储网络,以访问待保护的虚拟机数据。
    部署备份服务时,需为运行备份服务的虚拟机创建存储网卡,并确保备份服务可通过选择的虚拟机网络连通集群的存储网络。因此,在部署备份服务前,需确保集群的存储网络所属 VDS 上已创建了虚拟机网络。
  • 规划备份服务的备份网络
    备份服务通过备份网络将虚拟机数据备份至存储库。
    • 若备份存储库与集群的管理网络或存储网络连通,则备份网络可直接复用管理网卡或存储网卡,无需额外创建备份网卡。
    • 若备份存储库与集群的管理网络或存储网络都不连通,则集群需提前创建与备份存储库连通的 VDS 和虚拟机网络。部署备份服务时,需为运行备份服务的虚拟机创建备份网卡,并确保备份服务可通过选择的虚拟机网络连通备份存储库。

规划许可单元数量

SMTX 备份与容灾的软件许可单元数量由备份和复制两个模块共用,一个许可单元可对一个虚拟机进行备份或复制,但不可同时用于备份和复制同一虚拟机。因此,请您根据实际的业务需求,综合考虑需要保护的虚拟机数量、要使用的功能模块以及未来业务的扩展等,提前规划需要购买的许可单元数量。

 

继续阅读