SmartX 博客：问题答疑

SMTX OS 社区版支持配置一块/两块 SSD 作为缓存盘并不是因为需要去隔读和写缓存，每一块缓存盘都可以同时作为读、写缓存，配置两块 SSD 的目的主要是解决系统和缓存的高可用的问题。在实际使用中， SSD 故障是一个常见问题，而 SMTX OS 配置 2 块 SSD 作为缓存，可容忍任意一块 SSD 故障，另外一块 SSD 依然可以承担节点的缓存加速功能（只是缓存容量减少了）。另外值得注意一点：SMTX OS 缓存盘支持全局磁盘加速，并不是基于磁盘组做缓存加速。因此在单个 SSD 故障的场景下，缓存功能既不会失效，也不会引起部分数据存储空间下线的问题（磁盘组发生 SSD 故障，全组磁盘会同时下线）。

问题答疑

如果 SMTX OS 集群里只有两节点，在节点都正常的情况下，能选举成功吗？两节点集群下，挂一个节点后，可以不要求继续工作，是否支持？

首先说明一点： SMTX OS 标准集群是 3 节点或以上的，社区版虽然可支持部署 2 节点，但仅用于体验（允许后续扩展为 3 节点），正式使用必须是 3 节点或以上的。当集群只有 2 节点，集群能正常工作，能选举成功，但不支持高可用。一旦 2 节点再挂 1 个节点，整个集群就无法提供服务。

问题答疑

ZBS 是以哪个开源系统来二次开发的？

SMTX ZBS 是 SmartX 完全自研的分布式块存储，不是基于任何一种开源存储做二次开发，核心完全自主可控。

问题答疑

ZBS 的快照/克隆有限制吗？克隆卷是否能再克隆，嵌套深度有限制吗？

SMTX OS 单个集群最大支持 100000 组快照，而单个虚拟机最大支持 1024 个快照（vSphere 单个虚拟机最大支持 32 个快照）。虚拟机克隆没有数量限制。

问题答疑

如果集群有多个节点，每个节点存储容量都小于某个虚拟机的存储容量，但集群总存储容量足够进行数据恢复和多副本。在这种情况下，本节点宕机后，虚拟机是否能（通过 HA）自动恢复运行？

可以恢复，虚拟机磁盘的容量由 SMTX ZBS 分布式块存储提供，即使每个节点的磁盘容量都小于当前虚拟机磁盘容量，但只要多副本之后的容量大于虚拟机磁盘容量就可以，只是会影响 I/O 本地化，当节点宕机时，虚拟机可以在其他节点拉起。

问题答疑

如果要删除一个虚拟机的快照（100GB），是不是要保障虚拟机放置位置，至少还有多余的 100GB 空间，才可以执行？

我们的快照本身是独立的，删除快照的时候，不需要额外占用空间。

问题答疑

3 个节点组成集群，如这 3 个节点突然全部掉电了，当电力恢复后集群业务虚拟机会出现起不来的情况吗？

SMTX OS 有专门的机制应对集群整体掉电的情况，通过 IO 日志重放的机制确保数据的一致性。当集群恢复电力后，集群将会自动恢复服务，开启 HA 保护的虚拟机也会自动启动。

问题答疑

SmartX 本身是基于什么系统的？CentOS？有基于安可系统的版本吗？

目前社区版本 SMTX OS 是基于 CentOS 基础上开发的。但最新发布商业版已经改为基于OpenEuler 操作系统。

问题答疑

社区版开启 RDMA 有指导手册吗？

社区版不支持 RDMA 网络，SMTX OS 商业版本可支持 RDMA 网络。

问题答疑

请问社区版是否支持手动删除节点？

社区版不支持删除节点操作。如需要对社区版集群进行硬件替换，可以新建一个 SMTX OS 集群，并通过 SMTX 迁移工具进行原有集群的虚拟机迁移到新集群，然后再对原有集群硬件进行调整并重组集群。

问题答疑

单个虚拟机快照可以保存多少个呢？

单个虚拟机最多可保存 1024 个快照，单个集群最多可保存 100000 个快照。

问题答疑

SmartX 的热迁移是怎么实现的？采用 post copy 还是 pre copy？如果是 pre copy，针对脏页数据多时有明显的迁不动问题，你们有针对的优化处理的方案吗？

并不是采用的 post-copy，而是采用 pre-copy + auto converge 的方式进行虚拟机热迁移。您提到的问题，主要是因为两个原因导致的，一个是脏页生成速度太快，另外一个是由于带宽不足，所以导致内存复制速度赶不上脏页的生成速度。我们专门为大内存虚拟机在线迁移做了优化：
1. 在线迁移默认会自动选择存储网络（要求 10G 或以上网络）执行以保证传输带宽。

针对大内存虚拟机，而且是比较繁忙的虚拟机，支持有一种自动调节功能，当脏页的生成速度过快，自动调整 CPU 降低脏页生成速度，直到生成速度控制在阈值以内，限制就会取消。（迁移过程中对虚拟机的性能是有影响的）

问题答疑

SMTX OS 同城双活支持 Oracle 数据库么？

支持的，SMTX OS 双活集群属于拉伸集群，支持将 Oracle RAC 集群跨数据中心站点部署，其共享的数据盘是完全同步的。

问题答疑

SmartX 环境里，CPU 的超配比是多少？

没有硬性的超分指标，CPU 超分的比例跟业务的类型和 CPU 负荷压力相关，很难一概而论。如果业务 CPU 负荷比较大，高比例超分将大幅增大 CPU 等待时间，性能也会显著下降。

问题答疑

SMTX OS 集群部署选择分层和不分层有什么区别？

社区版仅支持分层部署。

分层：

使用高速介质（SSD）做缓存，低速介质做容量（HDD），对于混闪（SSD+HDD）集群，必须使用分层部署。

不分层：

不设置缓存盘。除了含有系统分区的物理盘，剩余的所有物理盘都作为数据盘使用。对其全闪集群（SATA/SAS SSD、Nvme SSD）可选择分层或者不分层部署。

问题答疑

ESXi 和 SmartX 虚拟化有什么区别？

可以查看我们博客集合：“VMware 替代合集 | 技术路线、厂商评估、技术分析与对比”。

问题答疑

SmartX 超融合支持通过 iSCSI 协议，将存储空间开放给 VMware 虚拟机使用么？

可以的。通过 CloudTower 界面在集群设置菜单中启用块存储服务，就可以把超融合的存储空间通过 iSCSI 提供给其他主机或虚拟机使用。

问题答疑

超融合软件是固化在超融合一体机里面的么？

SMTX Halo 超融合一体机预装了 SMTX OS 超融合软件，方便用户可以开箱即用；但超融合软件并不是以固件的形式固化在一体机硬件，用户可以方便地进行软件在线升级。

问题答疑

以 NVMe SSD 支持 vSAN 或者 ZBS 会比 SATA SSD 的性能好多少？

我们没有 NVMe 运行 vSAN 平台的相关数据。但针对 SMTX OS 有相关的测试对比：其中以 NVMe SSD 作为缓存的集群要比 SATA SSD 集群的性能更好，但同时需要更好的网络才可以充分发挥（一般 NVMe SSD 推荐搭配 25G 的 RDMA 网络），通常情况下能达到 SATA SSD 集群的性能 2 倍或以上，但在不同测试用例可能有所偏差。

问题答疑

能用 VMware Workstation 来搭建测试环境么？

VMware Workstation 一般装在个人 PC 上，内存和 CPU 的资源可能无法满足最低硬件要求，因此不建议在 Workstaion 上安装来体验我们的产品。关于社区版的硬件要求可参考社区专页：https://www.smartx.com/community/

问题答疑

AMD 的处理器可以安装 SmartX 超融合吗？

SMTX OS 支持 AMD 平台，具体支持型号，可以通过链接获取资料：https://www.smartx.com/resource/doc/general-hci/

问题答疑

SMTX OS 对数据的保护是基于副本吧，那服务器硬件上还需要配置 Raid 卡吗？

SMTX OS 上的数据是基于多副本技术提供数据冗余保护的，可支持两副本和三副本两种策略。服务器上既可不带 RAID 功能的 HBA 直通卡，或者是使用 RAID 卡并设置为直通（JBOD）模式。

问题答疑

超融合存储互联，有带宽的计算公式吗？与硬盘读写速度、IOPS 强相关吗？

超融合集群中存储网络交换机的选用跟集群硬盘介质有一定关系，如果是部署混闪集群（SSD+HDD），存储网络至少是 10G 网络；如果是采用了 NVMe SSD 全闪集群建议使用 25G 作为存储网络，这样可以充分发挥 NVMe 性能。

问题答疑

缓存的大小与数据盘的容量有对应关系吗？

要求单节点缓存盘的总容量:数据盘的总容量要大于 1:10。如：单节点配置了 4 块 4TB 的 HDD 硬盘作为数据盘（数据空间为 16TB），那么该节点至少需要配置 1.6 TB 以上的缓存空间，可选择使用 2 块容量为 960GB （大于 1.6TB ）的 SSD 作为缓存盘。

问题答疑

超融合架构下，网络交换机是如何部署的？需要多少台交换机？

在部署超融合集群时，一般划分为 3 组网络，分别为管理网络、存储网络、业务网络。这三组网络既可以分别接入三组不同的交换机，也可以是共用交换机（通过 vlan 隔离不同的网络），但前提是每一组交换机都是支持高可用（使用 2 台交换机配置堆叠或者虚拟化）。3 组网络完全独立的方案（高规格，隔离性好），每组由 2 台交换机组成高可用，那么是共需 6 台。如果考虑合并管理网络和业务网络在同一组交换机，存储网络独立的方案（常用规格，隔离性中等），则需要 4 台。

问题答疑

超融合用的系统盘和缓存盘，一般是读取型，还是读写型？

SSD 主要分读密集型、写密集型和混合密集型三种：读密集型 SSD 一般采用较低水平的配置，并使用相对不太耐用的闪存单元，具有较低的写入耐磨度，当然成本也会相对低廉。混合型 SSD 相比读密集型更耐用，配置更大的替换数据块。而写入密集型的固态硬盘则是最昂贵的固态硬盘，其性能好，写入寿命比较长。具体使用那种硬盘，需要视乎实际业务的需求，而超融合集群中的 SSD 通常作为缓存，写入操作是比较频繁的，考虑到性能和可靠性，建议是使用混合型或者写入密集型 SSD 作为缓存。

问题答疑

SMTX OS 原生备份是不是 CDP？

SmartX 的原生备份并不是基于 CDP 技术实现的，而是基于存储级别快照技术实现的虚拟机无代理备份，支持将运行在 ELF 平台上的虚拟机全量/增量备份到集群外部的 NAS 存储。此外，SmartX 超融合基础架构支持与 Zerto CDP 和英方 i2CDP 等第三方 CDP 软件集成组建灾备解决方案。

问题答疑

请问 SmartX 标准版支持通过 NFS 异地备份吗？我本地到异地专线只有10M 带宽可以支持吗？是备份整个虚拟机吗？我可以选择只备份数据吗？

SMTX OS 标准版可以搭配 SMTX 备份与恢复组件，将虚拟机备份到异地的 NFS 异地的 NFS 存储设备。10M 的带宽可以支持，带宽高低会影响备份和还原的速度。SMTX 备份与恢复组件是对虚拟机进行整机备份，不提供数据文件的单独备份。如有文件备份需求也可以考虑第三方的备份软件。

问题答疑

SMTX 迁移工具支持回迁吗？

v2v 迁移工具，可以将 VMware 虚拟机或者 ELF 集群的虚拟机迁移到 ELF 集群，不支持回迁到 VMware 集群，但是如果是 ELF 集群可以支持回迁。

问题答疑

SMTX 迁移工具是热迁移吗？

SMTX 迁移工具支持将 VMware 虚拟机迁移到 SMTX OS 集群，迁移过程是在线进行，不需要对源虚拟机关机或停止业务；在迁移接近结束前，需要对源虚拟机进行短暂关机以完成对迁移过程发生变化的数据重新同步以及更新驱动等操作，完成后虚拟机就可以正常启动。

问题答疑

医院的系统从物理机迁移到虚拟机，没有软件厂家配合的情况下，迁移成功率有保障吗？

x86 有很多成熟的 P2V 工具，迁移成功率是很高的，一般是不需要厂商进行配合，但是如果软件和硬件强绑定且存在许可相关的问题，还是需要厂商支持的。

问题答疑

如果从 Intel VMware 虚拟化平台迁移至海光 SmartX 虚拟化平台呢？兼容性有没有已知问题？

目前我们可以通过 SMTX 迁移工具，将 VMware 集群的虚拟机迁移到 SmartX 超融合集群（基于海光信创硬件）。一般情况下，虚拟机迁移完成后可正常运行；但由于 CPU 平台改变，不排除有部分应用可能出现兼容问题，建议对应用程序做一些必要的检查和测试之后才正式上线使用。

问题答疑

I/O 本地化之后，虚拟机执行在线迁移（到其他主机），相应的存储数据也会随之迁移（到对应主机）么？

虚拟机迁移完成之后，不会马上执行 I/O 本地化，而是会跨主机读读取数据副本。后台会记录远程读取时间持续超过 6 小时后（确认不是一次临时的迁移），会自动将数据副本通过数据迁移的方式迁移到新主机，并在新主机上重新形成 I/O 本地化。

问题答疑

部署 SMTX OS 时会校验缓存盘和数据盘是否存在坏道吗？

一般情况下，部署过程中并不会提前校验 HDD 的坏道，或者 SSD 的寿命（SSD 没有坏道的概念）等信息。但部署过程中由于磁盘故障导致分区等操作无法完成，那么系统会提示相应的报错。实际上，在集群初始化完成后，系统会对硬盘进行监控，可自动发现慢盘（频繁出现 I/O 延时过大），坏盘（频繁发生 I/O error ）以及剩余读写寿命较短的 SSD ，针对硬盘异常情况及时发出告警和隔离。

问题答疑

SmartX 超融合通过快速克隆创建虚拟机，（其原理）是链式克隆吧？后台会异步断链成完整克隆的镜像吗？

通过快速克隆创建的虚拟机，特性上有点类似链式克隆，但并不完全一样。快速克隆完成后，数据如果不发生变化，克隆出来的虚拟机与原有虚拟共享数据块，不额外占用空间。当数据发生变化后，克隆虚拟机会拥有独立的数据块，最终通常会与源虚拟机完全独立。

问题答疑

主机断电重启后，有自动启动虚拟机的功能吗？

有，需要开启虚拟机 HA 功能，开启 HA 功能之后，无论是当节点异常重启，还是集群重启，开机的虚拟机都会重新开机。

问题答疑

双活集群下，优先可用域没有足够计算资源的情况下，会尝试在次级可用域拉起虚拟机是吧？例如：优先可用域有 3 个节点，故障了 1 个节点，但是剩余 2 个节点计算资源不足够。这个时候会在次级可用域的节点上拉起虚拟机吗？

虚拟机开启了 HA 并且没有配置虚拟机放置组策略要求虚拟机必须在优先可用域中的主机运行的情况下，虚拟机在优先可用域计算资源不足的情况下，可在次级可用域中拉起。

问题答疑

超融合节点配置多块硬盘组成存储池，会要求每块硬盘容量大小是一致吗？还是都可以？

对于单块数据盘（HDD）不要求容量一致，但节点的总容量最好不要差距过大，否则容易出现数据分布过于集中于少数节点（或者容量较大的节点可以配置多于 2 台）。对于单块缓存盘的容量最好可以保持一致，其容量和性能不要差别太大，否则可能出现短板效应。

问题答疑

CloudTower 不能同时管理社区版和正式版的，是吗？

不可以，社区版 CloudTower 只能管理社区版的 SMTX OS 集群，商业版的CloudTower 只能管理商业版的 SMTX OS 集群。

问题答疑

SMTX OS 配置双活延展集群以后，支持站点间的 DRS 和迁移吗？

双活集群是可以支持站点之间在线迁移的，但前提是业务网可以支持大二层打通。此外，在双活的场景下虚拟机是有优先可用域的概念，虚拟机在优先可用域会有 2 个副本，另外一个站点有 1 个副本；数据读取会就近读取。因此也不建议在不同站点之间频繁迁移。

问题答疑

SSD 缓存必须要 2 块 NVMe 的是吧？

需要 2 块 SSD 作为缓存，但不一定是 NVMe SSD，SATA/SAS/NVMe 这几种 SSD 协议都是可以支持的。

问题答疑

IO 本地化会带来的空间利用率/性能不均衡问题是怎么解决的？Nutanix 是通过移动少量的实时使用的 extent 来平衡，SmartX 是怎么做的？

SMTX OS 也有内置的数据平衡功能，它会根据节点存储容量负载情况自动执行数据迁移，确保一定程度保持数据平衡。但数据本地化策略依然是优先的策略，当系统发现节点容量过高，它会优先尝试迁移非本地虚拟机非活跃的数据副本以维持数据容量均衡。SMTX OS 的数据平衡也是以 extent 为单位执行数据迁移的。

问题答疑

社区版 SMTX OS 集群能否添加外部共享存储？

社区版SMTX OS 集群属于超融合架构，内置分布式存储软件，无需接入外部存储。此外，目前社区版也不支持添加外部共享存储。

问题答疑

部署超融合集群，网络交换机需要做什么配置？需要堆叠吗？

交换机一般都不需要做特殊配置，生产环境建议交换机做高可用（2 台交换机堆叠或虚拟化）；另外，如果需要做基于 IP 的网络负载均衡，交换机配置 LACP，且在 SMTX OS 中设定绑定模式为 balance-tcp。

问题答疑

社区版 ovf 部署方案在 ESXi 7.0 主机上可行吗？

社区版 ovf 部署方案可以支持 ESXi 6.7 和 ESXi 7.0 。

问题答疑

请问一下，部署 SMTX OS 集群是否可以刚开始使用一块 SSD 作为缓存，后面再扩另外一块？

部署 SMTX OS 集群要求所有正式环境每个节点至少配置两块 SSD 作为缓存盘（同时承担系统盘作用）， 2 块 SSD 可确保支持缓存盘和系统的高可用。如果在集群初始化的时候只配置一块 SSD 作为缓存盘，后续扩展至 2 块 SSD 可扩展缓存空间，但依然无法支持故障切换的功能。因此建议在集群初始化的时候就为每个节点配置 2 块 SSD。

问题答疑

请问数据盘的型号不同会有木桶效应吗？我现在数据盘都是 5400 转的，不知道有没有必要换到同容量的 7200 转的？

分层模式情况下，数据盘（HDD ）型号不同并不会产生木桶效应，性能取决于缓存盘（SSD）。5400 转的 HDD 磁盘通常是家用级别磁盘居多，性能和可靠性都不及 7200 转的企业级硬盘，建议更换为 7200 转的企业级硬盘。

问题答疑

超融合场景下，一般常用的交换机品牌有哪些？如何选择？

交换机选择上，如果是混闪集群，推荐使用万兆交换机作为存储网络，如果是全闪集群，推荐使用 25G 交换机作为存储网络，管理网络交换机一般使用千兆交换机，而业务网络可根据业务需求选择千兆或者万兆交换机。

问题答疑

安装 SMTX OS 之前，如何清除硬盘中残留的软 RAID？

大部分情况下可以选择不清理，直接安装即可。如需清理，可使用 SMTX OS 安装光盘启动，在安装界面中输入 Ctrl+Alt+F2 进入命令行界面后，通过 fdisk 或 wipefs 进行清理，清理后重新启动服务器再执行安装。

问题答疑

为 SMTX OS 集群初始化时，其中一个全闪介质节点部署失败怎么办？

社区版是不支持全闪介质节点的（商业版可支持全闪节点），因此会引起部署失败，请配置为混闪节点再执行部署。

问题答疑

我部署了两次 everoute 都没成功，请问怎么排查问题？

按照以下几点进行排查：

确认集群节点数量，节点数必须大于等于 3 节点；
每个 Everoute Controller 的 IP 地址与集群的 SMTX OS 管理 IP 之间必须连通；
Everoute Controller 的 IP 地址之间必须连通。

问题答疑

导入申请的社区许可，验证是正常的，但保存时提示“许可无效”怎么处理？

通过虚拟机部署 SMTX OS 集群，不支持激活永久授权（但可试用 30 天），只有在物理裸金属服务器上部署 SMTX OS 集群才支持永久授权。

问题答疑

安装 Everoute 之后，在集群资源充足的情况下，CloudTower 为什么提示 HA 资源不足告警？

因为在 3 节点集群上部署 Everoute，默认会部署 3 个 Everoute Controller，虚拟机分别放置在 3 个不同节点上，以确保 Everoute 服务的高可用。而触发该告警的原因是：系统发现当集群中任意 1 个节点故障，该节点上的 Everoute Controller 本应通过 HA 功能在其他可用节点中恢复，但由于集群可用节点只剩下 2 个，无法保证 3 个 Everoute Controller 分别运行在不同节点，因此系统提示 HA 资源不足。在大于 3 节点的集群不会触发该报警，但由于社区版最大规模是 3 节点，因此一定会触发该告警，但不会影响日常使用。

问题答疑

业务网口设置为 trunk 模式后，业务虚拟交换机找不到在哪里设置?

当物理交换机对应端口配置好 trunk 模式之后，在集群中创建【虚拟分布式交换机】，关联对应的网口（调整为 trunk 模式的网口）。分布式交换机创建完成后，接着创建【虚拟机网络】，关联对应的虚拟分布式交换机，并设置 VLAN ID 和虚拟网络名称即可使用。

问题答疑

CloudTower 上传 ISO 速度比较慢，有速度限制吗？

当前 CloudTower 社区版（2.3.0）对上传 ISO 设置了限速（2M/s 以下），主要是防止上传过程中占用过多的带宽（如业务网络与管理网络共享带宽则有可能影响业务虚拟机网络访问）。新发布的版本其 ISO 上传速度将提升至最高 30M/s。

问题答疑

在 Fisheye 上传的 ISO 镜像，为什么在 CloudTower 无法看到？

Fisheye 属于 SMTX OS 集群应急管理平台，正常情况下 ISO 应该在 CloudTower 的内容库菜单中上传。在 Fisheye 上传的 ISO 信息无法同步到 CloudTower，需通过 CloudTower 重新上传 ISO。

问题答疑

怎样设置副本数？副本数能否针对单独的存储卷设置？可以设置单副本吗？

副本设置可在创建虚拟机时选择对应的副本策略。副本数可以针对虚拟机不同的虚拟磁盘分别进行设置。当前可支持的副本策略有 2 副本和 3 副本，但不支持设置单副本，主要因为单副本不具备任何数据冗余保护功能。

问题答疑

虚拟磁盘大小为什么与虚拟机系统内显示的大小不一致？

SMTX OS 虚拟磁盘容量的单位是 GiB（1GiB=1024MiB=1024*1024*1024 byte），而在操作系统内查询磁盘大小通常是以 GB（1GB=1000MB=1000*1000*1000 byte）为单位，因此导致两者显示的容量会不一致。

问题答疑

社区版如何从 2 节点扩展至 3 节点？

社区版推荐 3 节点部署，如前期资源比较紧张，可先进行两节点部署（2 节点集群不支持高可用），后续再扩容为标准的 3 节点集群（支持高可用）。扩容操作需在 CloudTower 界面上进行，扩容成功后需要执行后台命令进行角色转换（2 节点扩展至 3 节点必须的操作），详细方法可以在社区群咨询。

问题答疑

SMTX OS 安装 Windows 虚拟机时需要加载 virtio 硬盘驱动，但 PVE 就不需要安装 virtio 驱动？

PVE 在安装类型为 Windows 的虚拟机时，默认使用 IDE 磁盘总线，而不是性能更好的 virtio 总线（Windows 光盘中不带 virtio 驱动），因此，PVE 在安装 Windows 操作系统时并不需要额外加载 virtio 驱动。而 SMTX OS 安装虚拟机的时候默认会选用性能更好的 Virtio 总线，因此需要额外加载驱动。

问题答疑

SMTX OS 虚拟机的文件格式是什么?

SMTX OS 的虚拟机磁盘不是以文件的形式存在的，而是以虚拟卷（块设备）的形式存在。同时，SMTX OS 支持通过虚拟机磁盘文件以及 OVF 的方式进行导入。

问题答疑

SMTX OS 平台测试过安装 debian9 么，安装系统后无法正常加载系统？

SmartX 虚拟化平台 ELF 支持安装 debian9，但 debian9 对虚拟硬件有一定要求，磁盘需要选择 SCSI 总线，而虚拟显卡需要选择 VGA，这样就能正常完成系统安装并启动系统。

问题答疑

如果要对集群进行维护、更换硬件需要进行什么流程？需要手动迁移虚拟机然后直接关机吗？开机后是不是等集群恢复了，再继续弄下一台？

对节点进行硬件维护可以为节点开启维护模式（仅支持 3 节点或以上规模集群）后进行。SMTX OS 商业版可在 CloudTower 上操作，但社区版当前版本未支持该功能，需要手工执行以下步骤：

登录任意节点执行 sudo sh/ usr/ share/ upgrade/ upgrade_cluster/ script/ pre_check.sh，输出 pre check success 则预检查通过；如预检查失败，则需要根据提示处理之后再次进行检查；
将待维护节点上的虚拟机执行在线迁移至其他节点；
登录待维护节点，执行 sudo shutdown -h now，进行下电维护处理；
维护完成后，重新开启节点，等待集群状态恢复正常后（如有数据恢复，需等待数据恢复完成），回迁虚拟机；
如果有多个节点需要维护，需要依次按照前面的步骤执行。

问题答疑

如何将社区版集群新加入的物理服务器转换为主节点？

通过 CloudTower 添加节点成功后，需要登录到前面 2 个节点（添加节点前就存在）中的其中一个节点，执行 sudo zbs-cluster convert_to_master x.x.x.x 。x.x.x.x 指的是第 3 个添加的节点的存储 IP。

问题答疑

Nutanix 的虚拟机中的 raw 格式磁盘如何导入到 SmartX？

Nutanix 导出的 raw 磁盘，可登录 SmartX 节点管理页面 Fisheye，访问虚拟卷菜单，选择导入虚拟机磁盘；导入成功后，手工创建虚拟机并挂载已导入的虚拟磁盘即可。

问题答疑

CloudTower 有 API 文档么?

有的，在线 API 访问链接（最新）：https://code.smartx.com。社区版相关文档资料链接：https://pan.baidu.com/s/1Xy6uIcLtIygAidFdzVQLQA，提取码：yt0o。

问题答疑

通过 Fisheye 创建的网络有办法更换为 CloudTower 创建的么?

Fisheye 属于集群紧急管理页面，不应通过它去创建虚拟网络。日常操作应在 CloudTower 上进行。如果已经通过 Fisheye 创建了虚拟网络，可先将该虚拟网络关联的虚拟机移出，或调整到其他虚拟网络（该操作可能引起虚拟机网络中断）。清空虚拟网络后，可通过 Fisheye 界面删除该虚拟网络。然后再通过 CloudTower 新创建对应的虚拟网络，并将之前的虚拟机重新关联到该网络即可。

问题答疑

CloudTower 的分组没法跟用户或者角色绑定么？比如一个组的人可以看到本组的机器。

目前可以通过虚拟机分组去实现分组显示，也可以创建不同的管理角色。社区版后面也会加入 LDAP 用户的支持。

问题答疑

在集群中卸载 SSD 的时间挺长的，是为了不影响集群所以限速了是吗？

执行卸载 SSD 操作后，系统会将 SSD 的数据通过数据迁移的方式迁移到其他节点，同时系统会根据集群的负载情况对迁移进行限速，卸载时需要等待 SSD 上的数据完成迁移，因此持续时间会比较长。

问题答疑

raw 的磁盘文件如何挂载到新的虚拟机上面啊，直接 convert 成虚拟盘吗？

raw 格式的磁盘文件，可以直接在 Fisheye 虚拟卷界面进行上传，上传成功后，新建虚拟机，并选择该虚拟卷。

问题答疑

第三方 KVM 平台中 Windows 虚拟机迁移到 SMTX OS 后，为什么控制台鼠标没有反应（但键盘可以输入）？

可以查看是否有驱动冲突，一般情况是其他 KVM 平台使用了 usb-tablet 虚拟外设引起的。可尝试登录 Windows 虚拟机，在设备管理器中，卸载 usb-tablet 设备后再进行尝试。

问题答疑

系统警告存储平均延时过大，一般要查哪些因素呢？

触发存储平均延时过大警告一般有两个可能性：1. 某块磁盘（或者对应的磁盘控制器）发生故障了，导致访问延时增大，这种情况可以查看系统是否有磁盘健康相关的警告并作进一步的处理；2. 缓存空间比例过小，部分热数据无法在缓存命中。这种情况下可通过监控分析菜单查看集群的缓存命中率，如果缓存命中率持续偏低，则需要考虑扩展缓存空间。

问题答疑

两个集群之间的 ISO 镜像可以共用吗？

可以共用，如果当前这个集群上没有该镜像，通过内容库将镜像分发到对应集群，即可使用。

问题答疑

安装了 VM Tools 之后，Web 控制台不支持修改某个虚拟机的系统密码吗？

安装 vmtools 之后，在 CloudTower 中找到对应虚拟机的基本信息菜单，其中可以重置密码。如果没有该选项，请确认安装 vmtools 是否成功，或者 vmtools 版本是否过旧。

问题答疑

SmartX 的时间同步是先由集群的 leader 与 NTP Server 通讯并同步，然后 leader 负责内部节点时间同步的机制吧？那虚拟机迁移取的是硬件时间还是 SMTX OS 的系统时间？

SMTX OS 的 NTP 服务可以应对两种场景：

场景1：

有外部 NTP 服务源的情况下，leader 负责与外部 NTP 服务器同步时间，然后集群中其他节点与 leader 进行同步进而确保整个集群所有节点的时间都是同步的。而在线迁移或者数据同步都会依赖这个时间的。

场景2：

如果没有外部 NTP 服务器，那么 leader 不会跟外部进行同步，其他节点会跟 leader 同步时间，也可以保证整个集群的时间是一致的，但无法保证与标准时间是同步的。

关于 SmartX 公司

为企业构建易用、可靠、随需扩展的数据中心基础架构，满足企业的 IT 应用需求，是 SmartX 的使命和存在的价值。

进一步了解

在 SmartX 工作

SmartX 以独有的价值观吸引着一群热爱创造的人们相聚于此，共同打造坚实、稳固的 IT 基础架构。SmartX 欢迎你！

查看工作机会