标签虚拟机迁移

用户实战:灾备建设场景的 VMware 虚拟机迁移规划与实操经验分享

目前,众多金融机构按照行业规范和内部要求,建立起较为完备的 IT 基础设施灾备方案和容灾演练体系。不过,已有的灾备体系大多是基于 VMware 虚拟化环境和国外灾备产品进行建设,面对信创转型趋势和越来越严格的容灾切换标准,不少金融机构都在同步探索灾备基础设施升级改造与 VMware 迁移方案。

合集|医疗行业 VMware 升级替代方案、迁移与落地

为了加快实现医院 IT 数字化转型、满足电子病历与互联互通等评级要求,不少医疗机构已逐渐从传统虚拟化+集中式存储架构,转向了更为先进的超融合架构,如同时使用 VMware vSphere 和 vSAN。不过随着博通完成对 VMware 的收购,加之近几年提上日程的信创转型要求,“VMware 国产化替代”正在成为医疗行业 IT 架构转型的下一步重点。

SmartX 的热迁移是怎么实现的?采用 post copy 还是 pre copy?如果是 pre copy,针对脏页数据多时有明显的迁不动问题,你们有针对的优化处理的方案吗?

并不是采用的 post-copy,而是采用 pre-copy + auto converge 的方式进行虚拟机热迁移。您提到的问题,主要是因为两个原因导致的,一个是脏页生成速度太快,另外一个是由于带宽不足,所以导致内存复制速度赶不上脏页的生成速度。我们专门为大内存虚拟机在线迁移做了优化:
1. 在线迁移默认会自动选择存储网络(要求 10G 或以上网络)执行以保证传输带宽。

针对大内存虚拟机,而且是比较繁忙的虚拟机,支持有一种自动调节功能,当脏页的生成速度过快,自动调整 CPU 降低脏页生成速度,直到生成速度控制在阈值以内,限制就会取消。(迁移过程中对虚拟机的性能是有影响的)

如果从 Intel VMware 虚拟化平台迁移至海光 SmartX 虚拟化平台呢?兼容性有没有已知问题?

目前我们可以通过 SMTX 迁移工具,将 VMware 集群的虚拟机迁移到 SmartX 超融合集群(基于海光信创硬件)。一般情况下,虚拟机迁移完成后可正常运行;但由于 CPU 平台改变,不排除有部分应用可能出现兼容问题,建议对应用程序做一些必要的检查和测试之后才正式上线使用。

如果要对集群进行维护、更换硬件需要进行什么流程?需要手动迁移虚拟机然后直接关机吗?开机后是不是等集群恢复了,再继续弄下一台?

对节点进行硬件维护可以为节点开启维护模式(仅支持 3 节点或以上规模集群)后进行。SMTX OS 商业版可在 CloudTower 上操作,但社区版当前版本未支持该功能,需要手工执行以下步骤:

登录任意节点执行 sudo sh/ usr/ share/ upgrade/ upgrade_cluster/ script/ pre_check.sh,输出 pre check success 则预检查通过;如预检查失败,则需要根据提示处理之后再次进行检查;
将待维护节点上的虚拟机执行在线迁移至其他节点;
登录待维护节点,执行 sudo shutdown -h now,进行下电维护处理;
维护完成后,重新开启节点,等待集群状态恢复正常后(如有数据恢复,需等待数据恢复完成),回迁虚拟机;
如果有多个节点需要维护,需要依次按照前面的步骤执行。

SmartX 的时间同步是先由集群的 leader 与 NTP Server 通讯并同步,然后 leader 负责内部节点时间同步的机制吧? 那虚拟机迁移取的是硬件时间还是 SMTX OS 的系统时间?

SMTX OS 的 NTP 服务可以应对两种场景:

场景1:

有外部 NTP 服务源的情况下,leader 负责与外部 NTP 服务器同步时间,然后集群中其他节点与 leader 进行同步进而确保整个集群所有节点的时间都是同步的。而在线迁移或者数据同步都会依赖这个时间的。

场景2: 

如果没有外部 NTP 服务器,那么 leader 不会跟外部进行同步,其他节点会跟 leader 同步时间,也可以保证整个集群的时间是一致的,但无法保证与标准时间是同步的。

关于 SmartX 公司

为企业构建易用、可靠、随需扩展的数据中心基础架构,满足企业的 IT 应用需求,是 SmartX 的使命和存在的价值。

进一步了解

在 SmartX 工作

SmartX 以独有的价值观吸引着一群热爱创造的人们相聚于此,共同打造坚实、稳固的 IT 基础架构。SmartX 欢迎你!

查看工作机会