概述

自 SMTX OS 社区版发布以来,有许多用户下载了和尝试部署 SMTX OS ,在过程中遇到一些问题并在社区中提问,本文是将这些有代表性的问题集合在一起,并按照不同阶段进行分类,希望能帮助用户快速获得解决问题的思路。

另外,如用户希望全面了解 SMTX OS 部署过程,请参考以下两篇文章:

社区版安装部署指南:https://www.smartx.com/web-docs/docs/installation_guide/installation_guide_01.html

极限挑战:如何用2台服务器搭建超融合集群:https://zhuanlan.zhihu.com/p/433473572

目录

SMTX OS 社区版安装使用中常见问题合集(产品前期了解篇)

SMTX OS 社区版安装使用中常见问题合集(部署准备篇)

SMTX OS 社区版安装使用中常见问题合集(系统安装篇)

SMTX OS 社区版安装使用中常见问题合集(使用过程篇)

产品前期了解篇

问题:社区版后期能直接转到商业版本吗?

回答:可以的,导入正式软件许可以及软件升级可转为商业版本。

问题:社区版和正式版功能区别主要在哪里呀?

回答:

对比项 社区版 正式版
授权 社区版授权(包含 SMTX OS 和 CloudTower ) 基础版、标准版、企业版
使用时限 官网申请社区永久许可,可一直免费使用 免费试用许可 1 个月

商业永久许可(一次性付费)和订阅许可(按年付费)

节点规模 SMTX OS  社区版最大集群规模 3 个节点,

CloudTower 社区版最多支持纳管 3 个社区版集群

基础版(5)、标准版(16)、企业版(最大255)
虚拟化平台支持 仅支持部署 ELF 支持 ELF、ESXi 或者 XenServer
服务与技术支持 不提供正式的服务与技术支持,

有问题可以到社区去留言,但不保证时效性

提供企业售后服务,具体细节跟服务的等级相关

问题:SmartX 的存储属于块存储吗?

回答:是的,SMTX OS 内置了 ZBS 分布式块存储软件,提供原生的块存储服务。

问题:社区版支持与 VMware 集成超融合的模式吗 ?

回答:不支持,商业版才可以支持,详细请查阅:社区版和正式版功能区别主要在哪里呀?

问题:社区版支持哪些客户操作系统,实体机如何迁移到虚拟机上?而 VMware 的虚拟机又如何迁移?

回答:主流的 Windows 和 Linux 操作系统都是支持的,具体可以看 SMTX OS 的兼容列表;从 VMware ESXi 迁移到 ELF (SMTX OS 内置虚拟化软件),我们提供了免费的 V2V 工具,可支持从 ESXi 在线迁移虚拟机到 ELF 上。

问题:VirtualBox 的虚拟机支持迁移到社区版吗?

回答:可以的,但对于 VirtualBox 的虚拟机,目前 SmartX 官方没有提供专门的 V2V 工具,但可以通过导入到平台后,通过内置的命令行工具进行格式转换,以及涉及一些手工操作,相对 VMware 的虚拟机操作上相对麻烦一些。

问题:社区版有(内置的)性能观测工具么?能观测到 VM 中卷的 IO (以及)在缓存盘和数据盘的分布(情况)及热点(数据)情况不?

回答:有的,系统内置监控报表功能,可以提供实时(历史数据分析需要商业版支持)的缓存命中率, 虚拟机的 IO 延时情况,IOPS 统计等。

问题:你们的分布式储存软件(SMTX ZBS)可以提供测试吗?

回答:SMTX ZBS 分布式存储软件商业版已经在 2021 Q4 发布,可以提供 30 天免费测试许可,但对应的社区版暂时还没有发布,预计会在晚些时候发布。

问题:社区版怎么申请永久使用?

回答:社区版安装完成后,可在管理界面获取系统序列号,凭序列号,访问 SmartX 官网,填入一些基本信息,即可申请永久许可。

许可申请页面:https://www.smartx.com/community-license/

问题:三个节点(3 台服务器组成的)集群可以跑两百多个虚拟机么?

回答:这个问题不能一概而论,集群能运行多少台虚拟机主要看服务器和虚拟机的资源配置,(满足 3 主机运行 200+ 虚拟机)单台主机运行 66 台虚拟机,相对来说属于密度比较高的情况。据实际经验,生产环境一般单台主机运行 20-30 个虚拟机,开发测试环境运行 50 台左右。

问题:SmartX 社区版有类似 VMware 的 FT 容错功能吗?

回答:SmartX 社区版没有提供类似 VMware 的 FT 容错功能。

问题:请问虚拟机软件(SMTX OS)是自己开发的吗?

回答:SMTX ELF 虚拟化软件是在 KVM 的基础上开发的,但自行开发了包括 HA、自动调度、高级监控等企业级的功能。

问题:请问服务器扩充硬件会影响 SmartX 系统运行吗?例如:加硬盘?加内存?扩展后软件需要调整吗?

回答:在线增加硬盘是不会影响系统正常运行的;添加内存操作需停机进行,如果希望避免影响业务,可以先通过在线迁移将需要增加内存的主机上的虚拟机到另外两个可用节点(前提是集群拥有三个节点,否则必须全部停机进行扩容),然后关闭节点进行内存添加,这样可以不影响业务正常运行;由于集群有节点离线,系统会自动触发数据恢复;服务器扩展硬件后不需要调整软件设置,同时也不涉及软件许可费用增加的问题(社区版免费,商业版本的许可是按 2CPU 节点为一个许可,跟内存、硬盘大小无关)

问题:SMTX OS 有专门的超融合管理节点吗?或者说有单个或几个管理虚拟机吗?CloudTower 有冗余吗,例如:主备虚拟机吗?如果是单台,那管理虚拟机挂了,客户不就无法管理了嘛?

回答:目前 CloudTower 没有提供主备虚拟机冗余的,但 CloudTower 虚拟机故障并不影响集群的正常运作,并且每个服务器节点本身已经有管理界面的,可提供应急管理平面。

问题:三节点集群,当有一个节点宕机后,上面的虚拟机重新在别的节点上拉起需要多久?

回答:SMTX OS 的 HA 触发时间是 3 分钟,当系统检测到节点宕机后,会在三分钟之内触发 HA ,虚拟机会自动迁移到其他节点并重新启动。

问题:如果主机故障(无法维修),更换的服务器与原服务器配置不同,会有影响吗?

回答:新更换的服务器首先得满足 SMTX OS 的硬件兼容性要求,在这个前提下,SmartX 集群是允许节点配置的不完全一致的,包括 CPU、内存、硬盘等配件不一致都是支持的。但一下情况需要考虑的。例如,集群内主机可以使用代数相近但型号不同的 CPU ,并可支持不同 CPU 之间的虚拟机迁移,但是如果 CPU 的年代相差较远,那么在线迁移功能也可能受到影响;另外,如果新增硬件相比原有服务器的性能是有所下降,也可能会导致集群性能的下降。

问题:请问超融合 3 节点(集群)如果都因为停电后(电力又恢复后)重启了,承载的虚拟机是按什么流程重启的,同时启动的话会不会造成设备超载?

回答:如果是集群所有节点都掉电,电力恢复后,虚拟机还是会在源主机上启动的,不会因为都迁移到一台主机上引起超载的问题。另外,如果是触发 HA 的情况下,虚拟机的启动是以随机的顺序轮流启动的,并不是所有虚拟机同一时刻启动的;启动顺序目前是不支持手工调整的,由系统决定。

问题:SMTX OS 要求硬盘直通,没有 RAID 保护,那么坏一个硬盘数据会不会丢啊?

回答:不会丢数据。因为 SMTX OS 的数据冗余不依赖 RAID 技术实现,而是通过多副本技术实现。当虚拟机写入数据,系统会根据存储策略自动写入 2 份或者 3 份,虚拟机本地主机有一份数据,远程主机有另外 1 份(3 副本下则有另外 2 份数据写入到另外两台不同的主机上)。这样的机制使得无论是遭遇单个硬盘故障还是主机故障,至少能在另外一个主机找到对应的数据副本可用,并可通过数据恢复自动恢复到预期级别,保障数据的可靠性。

问题:SMTX OS 主机中每块盘都是独立的吗?可以支持并发读写吗?

回答:SMTX OS 主机上的数据盘和缓存盘都是直通的,没有组建 RAID 组,因此可以理解是独立的。SMTX OS 无需专门的热备盘,多块数据盘和缓存盘支持并发读写。

问题:服务器故障需要一个恢复的过程吗,恢复期间能提供服务吗?

回答:当集群中有服务器发生故障,集群会将故障的服务器上面的 VM 通过 HA 功能自动迁移至其他可用的服务器节点上并自动恢复运行,同时会自动执行数据恢复,保障数据可靠性;而没有故障的主机上的虚拟机不受影响,整个数据恢复过程,系统会监控集群的负载情况自动调节恢复速度,最大程度保障现有业务性能和响应速度。

问题:能不能评价 EC 功能?相对主打 EC 功能的超融合产品,SmartX 的优势在哪里?

回答:RAID、副本、EC 这些都是数据冗余的保障手段,这些技术有各自的特点,以及不同的适用场景。例如 EC 它的机制与 RAID 5/6 差不多,通过多位校验算法,提高得盘率(节省空间),但同时消耗更多的计算资源,并且降低了 IO 性能。而副本技术更简单,性能好,但缺点是只有 50% 得盘率。而 SmartX 采用的是副本技术,并没有采用 EC 技术,主要考虑超融合的特征计算和存储是融合部署的(两者存在资源竞争的关系),数据冗余算法对 CPU 和内存消耗越低,那么主机更多的资源可用于运行虚拟机的资源就越多。而实际上 SMTX OS 的资源消耗基本上是业内最低,并且 IO 性能也是业内领先的水平。

如果大家对得盘率依然耿耿于怀,无非是对成本有更高的期望,那么我们可以细想一下,在混闪集群中,数据盘都是采用廉价的 SATA HDD,难道 CPU 资源不比 HDD 更加昂贵?EC 技术无非就是降硬盘的成本,但它需要更多的内存和 CPU 资源,在超融合环境下,代价可能更高。

问题:SMTX OS 缓存机制是 write back 还是 write through?一般是建议客户使用哪种缓存策略??

回答:SMTX OS 缓存策略是系统自动执行的,无需客户选择的。SMTX OS 缓存机制不属于传统的 write back 和 write through 机制,更准确地说是一种改进版 write back 机制,它既保留了 write back 机制的高效性能,同时有专门的机制应对突发断电引起的数据无法及时更新的问题。

问题:如果出现意外掉电等情况,是如何保证数据一致的?缓存盘的脏数据是否有脏数据保护措施么?

回答:缓存盘的数据实际上也有多副本保护,并且遵循强一致性的特点。另外,在系统遭遇意外掉电的情况下,系统将通过 Journal 的 IO 回放功能确保数据一致性。

问题:SMTX OS 集群中,使用 PMEM 与 NVMe SSD (作为缓存)性能上的差距应该不小吧?成本上的差异是否也是巨大的?

回答:两者性能差距是比较大的,SMTX OS 支持 Intel 持久化内存(PMEM)作为缓存,该方案下 IO 延时可低至 100us,3 节点集群 IOPS 超过 100 万(是 NVMe 的 2.5 倍以上)。PMEM 本身硬件成本上升并不算明显,但目前这个方案只提供一体机支持,并需要 SMTX OS 企业版许可;另外,存储网络也需要升级到 25G 以上的 RDMA 网络(推荐使用 100G RDMA 网络)。 方案主要应对一些对延时要求极高的应用。

问题:第三方认证走的是支持 LDAP 协议吗还是 OAuth?

回答:支持 LDAP,但当前社区版还未发布该功能,后续版本会加入该功能。

问题:单个虚拟机支持最大存储空间,有限制吗?

回答:虚拟机单个虚拟磁盘最大容量支持 64TB,如需要更大的空间可为虚拟机添加多块虚拟磁盘。

问题:SmartX 有云管平台吗?

回答:SmartX 目前没有自己的云管平台,当前主要和第三方云管平台进行对接,如 Fit2Cloud、骞云等。

问题:单机部署的情况下,存储盘没有冗余机制,存储盘得需要做 Raid 吧?

回答:单节点部署只可用于产品体验,不提供任何数据冗余保护,同时也不支持通过组 Raid 来代替副本保护。

问题:超融合可用于归档吗?

回答:SmartX 超融合属于计算和存储融合的部署架构,归档一般只需要存储服务,这种通常不太适合归档服务。

问题:超融合的 VM 在线迁移功能,走的是哪个网?

回答:SMTX OS 虚拟机的在线迁移默认通过存储网络执行迁移。

问题:为什么缓存盘还要 2 块呢?一读一写吗?

回答:SMTX OS 社区版支持配置一块/两块 SSD 作为缓存盘并不是因为需要去隔读和写缓存,每一块缓存盘都可以同时作为读、写缓存,配置两块 SSD 的目的主要是解决系统和缓存的高可用的问题。在实际使用中, SSD 故障是一个常见问题,而 SMTX OS 配置 2 块 SSD 作为缓存,可容忍任意一块 SSD 故障,另外一块 SSD 依然可以承担节点的缓存加速功能(只是缓存容量减少了)。另外值得注意一点:SMTX OS 缓存盘支持全局磁盘加速,并不是基于磁盘组做缓存加速。因此在单个 SSD 故障的场景下,缓存功能既不会失效,也不会引起部分数据存储空间下线的问题(磁盘组发生 SSD 故障,全组磁盘会同时下线)。

问题:如果 SMTX OS 集群里只有两节点,在节点都正常的情况下,能选举成功吗? 两节点集群下,挂一个节点后,可以不要求继续工作,是否支持?

回答:首先说明一点: SMTX OS 标准集群是 3 节点或以上的,社区版虽然可支持部署 2 节点,但仅用于体验(允许后续扩展为 3 节点),正式使用必须是 3 节点或以上的。当集群只有 2 节点,集群能正常工作,能选举成功,但不支持高可用。一旦 2 节点再挂 1 个节点,整个集群就无法提供服务。

问题:ZBS 是以哪个开源系统来二次开发的?

回答:SMTX ZBS 是 SmartX 完全自研的分布式块存储,不是基于任何一种开源存储做二次开发,核心完全自主可控。

问题:ZBS 的快照/克隆有限制吗?克隆卷是否能再克隆,嵌套深度有限制吗?

回答:SMTX OS 单个集群最大支持 100000 组快照,而单个虚拟机最大支持 1024 个快照(vSphere 单个虚拟机最大支持 32 个快照)。虚拟机克隆没有数量限制。

问题:如果集群有多个节点,每个节点存储容量都小于某个虚拟机的存储容量,但集群总存储容量足够进行数据恢复和多副本。在这种情况下,本节点宕机后,虚拟机是否能(通过 HA)自动恢复运行?

回答:可以恢复,虚拟机磁盘的容量由 SMTX ZBS 分布式块存储提供,即使每个节点的磁盘容量都小于当前虚拟机磁盘容量,但只要多副本之后的容量大于虚拟机磁盘容量就可以,只是会影响 I/O 本地化,当节点宕机时,虚拟机可以在其他节点拉起。

问题:如果要删除一个虚拟机的快照(100GB),是不是要保障虚拟机放置位置,至少还有多余的 100GB 空间,才可以执行?

回答:我们的快照本身是独立的,删除快照的时候,不需要额外占用空间。

问题:3 个节点组成集群,如这 3 个节点突然全部掉电了,当电力恢复后集群业务虚拟机会出现起不来的情况吗?

回答:SMTX OS 有专门的机制应对集群整体掉电的情况,通过 IO 日志重放的机制确保数据的一致性。当集群恢复电力后,集群将会自动恢复服务,开启 HA 保护的虚拟机也会自动启动。

问题:SmartX 本身是基于什么系统的?CentOS?有基于安可系统的版本吗?

回答:目前社区版本 SMTX OS 是基于 CentOS 基础上开发的。但最新发布商业版已经改为基于OpenEuler 操作系统。

问题:社区版开启 RDMA 有指导手册吗?

回答:社区版不支持 RDMA 网络,SMTX OS 商业版本可支持 RDMA 网络。

问题:请问社区版是否支持手动删除节点?

回答:社区版不支持删除节点操作。如需要对社区版集群进行硬件替换,可以新建一个 SMTX OS 集群,并通过 SMTX 迁移工具进行原有集群的虚拟机迁移到新集群,然后再对原有集群硬件进行调整并重组集群。

问题:快照可以保存多少个呢?

回答:单个虚拟机最多可保存 1024 个快照,单个集群最多可保存 100000 个快照。

问题:SmartX 的热迁移是怎么实现的?采用 post copy 还是 pre copy?如果是 pre copy, 针对脏页数据多时有明显的迁不动问题,你们有针对的优化处理的方案吗?

回答:并不是采用的 post-copy,而是采用 pre-copy + auto converge 的方式进行虚拟机热迁移。您提到的问题,主要是因为两个原因导致的,一个是脏页生成速度太快,另外一个是由于带宽不足,所以导致内存复制速度赶不上脏页的生成速度。我们专门为大内存虚拟机在线迁移做了优化:
1. 在线迁移默认会自动选择存储网络(要求 10G 或以上网络)执行以保证传输带宽。

  1. 针对大内存虚拟机,而且是比较繁忙的虚拟机,支持有一种自动调节功能,当脏页的生成速度过快,自动调整 CPU 降低脏页生成速度,直到生成速度控制在阈值以内,限制就会取消。(迁移过程中对虚拟机的性能是有影响的)

问题:SMTX OS 同城双活支持 Oracle 数据库么?

回答:支持的,SMTX OS 双活集群属于拉伸集群,支持将 Oracle RAC 集群跨数据中心站点部署,其共享的数据盘是完全同步的。

问题:SmartX 环境里,CPU 的超配比是多少?

回答:没有硬性的超分指标,CPU 超分的比例跟业务的类型和 CPU 负荷压力相关,很难一概而论。如果业务 CPU 负荷比较大,高比例超分将大幅增大 CPU 等待时间,性能也会显著下降。

问题:SMTX OS 集群部署选择分层和不分层有什么区别?

回答:社区版仅支持分层部署。

分层:

使用高速介质(SSD)做缓存,低速介质做容量(HDD),对于混闪(SSD+HDD)集群,必须使用分层部署。

不分层:

不设置缓存盘。除了含有系统分区的物理盘,剩余的所有物理盘都作为数据盘使用。对其全闪集群(SATA/SAS SSD、Nvme SSD)可选择分层或者不分层部署。

问题:ESXi 和 SmartX 虚拟化有什么区别?

回答:可以查看我们博客集合:VMware 替代合集 | 技术路线、厂商评估、技术分析与对比

问题:SmartX 超融合支持通过 iSCSI 协议,将存储空间开放给 VMware 虚拟机使用么?

回答:可以的。通过 CloudTower 界面在集群设置菜单中启用块存储服务,就可以把超融合的存储空间通过 iSCSI 提供给其他主机或虚拟机使用。

问题:超融合软件是固化在超融合一体机里面的么?

回答:SMTX Halo 超融合一体机预装了 SMTX OS 超融合软件,方便用户可以开箱即用;但超融合软件并不是以固件的形式固化在一体机硬件,用户可以方便地进行软件在线升级。

问题:以 NVMe SSD 支持 vSAN 或者 ZBS 会比 SATA SSD 的性能好多少?

回答:我们没有 NVMe 运行 vSAN 平台的相关数据。但针对 SMTX OS 有相关的测试对比:其中以 NVMe SSD 作为缓存的集群要比 SATA SSD 集群的性能更好,但同时需要更好的网络才可以充分发挥(一般 NVMe SSD 推荐搭配 25G 的 RDMA 网络),通常情况下能达到 SATA SSD 集群的性能 2 倍或以上,但在不同测试用例可能有所偏差。

问题:能用 VMware Workstation 来搭建测试环境么?

回答:VMware Workstation 一般装在个人 PC 上,内存和 CPU 的资源可能无法满足最低硬件要求,因此不建议在 Workstaion 上安装来体验我们的产品。关于社区版的硬件要求可参考社区专页:https://www.smartx.com/community/

问题:AMD 的处理器可以安装 SmartX 超融合吗?

回答:SMTX OS 支持 AMD 平台,具体支持型号,可以通过链接获取资料:https://www.smartx.com/resource/doc/general-hci/

问题:SMTX OS 对数据的保护是基于副本吧,那服务器硬件上还需要配置 Raid 卡吗?

回答:SMTX OS 上的数据是基于多副本技术提供数据冗余保护的,可支持两副本和三副本两种策略。服务器上既可不带 RAID 功能的 HBA 直通卡, 或者是使用 RAID 卡并设置为直通(JBOD)模式。

问题:超融合存储互联,有带宽的计算公式吗?与硬盘读写速度、IOPS 强相关吗?

回答:超融合集群中存储网络交换机的选用跟集群硬盘介质有一定关系,如果是部署混闪集群(SSD+HDD),存储网络至少是 10G 网络;如果是采用了 NVMe SSD 全闪集群建议使用 25G 作为存储网络,这样可以充分发挥 NVMe 性能。

问题:缓存的大小与数据盘的容量有对应关系吗?

回答:要求单节点缓存盘的总容量:数据盘的总容量要大于 1:10。如:单节点配置了 4 块 4TB 的 HDD 硬盘作为数据盘(数据空间为 16TB),那么该节点至少需要配置 1.6 TB 以上的缓存空间,可选择使用 2 块容量为 960GB (大于 1.6TB )的 SSD 作为缓存盘。

问题:部署超融合集群,交换机一般需要配多少台?6 台?

回答:在部署超融合集群时,一般划分为 3 组网络,分别为管理网络、存储网络、业务网络。这三组网络既可以分别接入三组不同的交换机,也可以是共用交换机(通过 vlan 隔离不同的网络),但前提是每一组交换机都是支持高可用(使用 2 台交换机配置堆叠或者虚拟化)。3 组网络完全独立的方案(高规格,隔离性好),每组由 2 台交换机组成高可用,那么是共需 6 台。如果考虑合并管理网络和业务网络在同一组交换机,存储网络独立的方案(常用规格,隔离性中等),则需要 4 台。

问题:超融合用的系统盘和缓存盘,一般是读取型,还是读写型?

回答:SSD 主要分读密集型、写密集型和混合密集型三种:读密集型 SSD 一般采用较低水平的配置,并使用相对不太耐用的闪存单元,具有较低的写入耐磨度,当然成本也会相对低廉。 混合型 SSD 相比读密集型更耐用,配置更大的替换数据块。而写入密集型的固态硬盘则是最昂贵的固态硬盘,其性能好,写入寿命比较长。具体使用那种硬盘,需要考虑实际业务的需求,而超融合集群中的 SSD 通常作为缓存,写入操作是比较频繁的,考虑到性能和可靠性,建议是使用混合型或者写入密集型 SSD 作为缓存。

问题:SMTX OS 原生备份是不是 CDP?

回答:SmartX 的原生备份并不是基于 CDP 技术实现的,而是基于存储级别快照技术实现的虚拟机无代理备份,支持将运行在 ELF 平台上的虚拟机全量/增量备份到集群外部的 NAS 存储。此外,SmartX 超融合基础架构支持与 Zerto CDP 和 英方 i2CDP 等第三方 CDP 软件集成组建灾备解决方案。

问题:请问 SmartX 标准版支持通过 NFS 异地备份吗?我本地到异地专线只有10M 带宽可以支持吗?是备份整个虚拟机吗?我可以选择只备份数据吗?

回答:SMTX OS 标准版可以搭配 SMTX 备份与恢复组件,将虚拟机备份到异地的 NFS 存储设备。10M 的带宽可以支持,带宽高低会影响备份和还原的速度。SMTX 备份与恢复组件是对虚拟机进行整机备份,不提供数据文件的单独备份。如有文件备份需求也可以考虑第三方的备份软件。

问题:SMTX 迁移工具支持回迁吗?

回答:v2v 迁移工具,可以将 VMware 虚拟机或者 ELF 集群的虚拟机迁移到 ELF 集群,不支持回迁到 VMware 集群,但是如果是 ELF 集群可以支持回迁。

问题:SMTX 迁移工具是热迁移吗?

回答:SMTX 迁移工具支持将 VMware 虚拟机迁移到 SMTX OS 集群,迁移过程是在线进行,不需要对源虚拟机关机或停止业务;在迁移接近结束前,需要对源虚拟机进行短暂关机以完成对迁移过程发生变化的数据重新同步以及更新驱动等操作,完成后虚拟机就可以正常启动。

问题:医院的系统从物理机迁移到虚拟机,没有软件厂家配合的情况下,迁移成功率有保障吗?

回答:x86 有很多成熟的 P2V 工具,迁移成功率是很高的,一般是不需要厂商进行配合,但是如果软件和硬件强绑定且存在许可相关的问题,还是需要厂商支持的。

问题:如果从 Intel VMware 虚拟化平台迁移至海光 SmartX 虚拟化平台呢?兼容性有没有已知问题?

回答:目前我们可以通过 SMTX 迁移工具,将 VMware 集群的虚拟机迁移到 SmartX 超融合集群(基于海光信创硬件)。一般情况下,虚拟机迁移完成后可正常运行;但由于 CPU 平台改变,不排除有部分应用可能出现兼容问题,建议对应用程序做一些必要的检查和测试之后才正式上线使用。

问题:I/O 本地化之后,虚拟机执行在线迁移(到其他主机),相应的存储数据也会随之迁移(到对应主机)么?

回答:虚拟机迁移完成之后,不会马上执行 I/O 本地化,而是会跨主机读读取数据副本。后台会记录远程读取时间持续超过 6 小时后(确认不是一次临时的迁移),会自动将数据副本通过数据迁移的方式迁移到新主机,并在新主机上重新形成 I/O 本地化。

问题:部署 SMTX OS 时会校验缓存盘和数据盘是否存在坏道吗?

回答:一般情况下,部署过程中并不会提前校验 HDD 的坏道,或者 SSD 的寿命(SSD 没有坏道的概念)等信息。但部署过程中由于磁盘故障导致分区等操作无法完成,那么系统会提示相应的报错。实际上,在集群初始化完成后,系统会对硬盘进行监控,可自动发现慢盘(频繁出现 I/O 延时过大),坏盘(频繁发生 I/O error )以及剩余读写寿命较短的 SSD ,针对硬盘异常情况及时发出告警和隔离。

问题:SmartX 超融合通过快速克隆创建虚拟机,(其原理)是链式克隆吧?后台会异步断链成完整克隆的镜像吗?

回答:通过快速克隆创建的虚拟机,特性上有点类似链式克隆,但并不完全一样。快速克隆完成后,数据如果不发生变化,克隆出来的虚拟机与原有虚拟共享数据块,不额外占用空间。当数据发生变化后,克隆虚拟机会拥有独立的数据块,最终通常会与源虚拟机完全独立。

问题:主机断电重启后,有自动启动虚拟机的功能吗?

回答:有,需要开启虚拟机 HA 功能,开启 HA 功能之后,无论是当节点异常重启,还是集群重启,开机的虚拟机都会重新开机。

问题:双活集群下,优先可用域没有足够计算资源的情况下,会尝试在次级可用域拉起虚拟机是吧?例如:优先可用域有 3 个节点,故障了 1 个节点,但是剩余 2 个节点计算资源不足够。这个时候会在次级可用域的节点上拉起虚拟机吗?

回答:虚拟机开启了 HA 并且没有配置虚拟机放置组策略要求虚拟机必须在优先可用域中的主机运行的情况下,虚拟机在优先可用域计算资源不足的情况下,可在次级可用域中拉起。

问题:超融合节点配置多块硬盘组成存储池,会要求每块硬盘容量大小是一致吗?还是都可以?

回答:对于单块数据盘(HDD)不要求容量一致,但节点的总容量最好不要差距过大,否则容易出现数据分布过于集中于少数节点(或者容量较大的节点可以配置多于 2 台)。对于单块缓存盘的容量最好可以保持一致,其容量和性能不要差别太大,否则可能出现短板效应。

问题:CloudTower 不能同时管理社区版和正式版的,是吗?

回答:不可以,社区版 CloudTower 只能管理社区版的 SMTX OS 集群,商业版的CloudTower 只能管理商业版的 SMTX OS 集群。

问题:SMTX OS 配置双活延展集群以后,支持站点间的 DRS 和迁移吗?

回答:双活集群是可以支持站点之间在线迁移的,但前提是业务网可以支持大二层打通。此外,在双活的场景下虚拟机是有优先可用域的概念,虚拟机在优先可用域会有 2 个副本,另外一个站点有 1 个副本;数据读取会就近读取。因此也不建议在不同站点之间频繁迁移。

问题:SSD 缓存必须要 2 块 NVMe 的是吧?

回答:需要 2 块 SSD 作为缓存,但不一定是 NVMe SSD,SATA/SAS/NVMe 这几种 SSD 协议都是可以支持的。

问题:IO 本地化会带来的空间利用率/性能不均衡问题是怎么解决的?Nutanix 是通过移动少量的实时使用的 extent 来平衡,SmartX 是怎么做的?

回答:SMTX OS 也有内置的数据平衡功能,它会根据节点存储容量负载情况自动执行数据迁移,确保一定程度保持数据平衡。但数据本地化策略依然是优先的策略,当系统发现节点容量过高,它会优先尝试迁移非本地虚拟机非活跃的数据副本以维持数据容量均衡。SMTX OS 的数据平衡也是以 extent 为单位执行数据迁移的。

问题:社区版 SMTX OS 集群能否添加外部共享存储?

回答:社区版SMTX OS 集群属于超融合架构,内置分布式存储软件,无需接入外部存储。此外,目前社区版也不支持添加外部共享存储。

继续阅读