概述

自 SMTX OS 社区版发布以来,有许多用户下载了和尝试部署 SMTX OS ,在过程中遇到一些问题并在社区中提问,本文是将这些有代表性的问题集合在一起,并按照不同阶段进行分类,希望能帮助用户快速获得解决问题的思路。

另外,如用户希望全面了解 SMTX OS 部署过程,请参考以下两篇文章:

社区版安装部署指南

极限挑战:如何用 2 台服务器搭建超融合集群

可以借助这个视频,手把手学习如何安装部署社区版。

还可以通过这个视频,解答你 SmartX 超融合套件社区版安装部署的各方面疑问。

产品前期了解篇

问题:社区版后期能直接转到商业版本吗?

回答:可以的,导入正式软件许可以及软件升级可转为商业版本。

问题:社区版和正式版功能区别主要在哪里呀?

回答:

对比项 社区版 正式版
授权 社区版授权(包含 SMTX OS 和 CloudTower ) 基础版、标准版、企业版
使用时限 官网申请社区永久许可,可一直免费使用 免费试用许可 1 个月

商业永久许可(一次性付费)和订阅许可(按年付费)

节点规模 SMTX OS  社区版最大集群规模 3 个节点,

CloudTower 社区版最多支持纳管 3 个社区版集群

基础版(5)、标准版(16)、企业版(最大255)
虚拟化平台支持 仅支持部署 ELF 支持 ELF、ESXi 或者 XenServer
服务与技术支持 不提供正式的服务与技术支持,

有问题可以到社区去留言,但不保证时效性

提供企业售后服务,具体细节跟服务的等级相关

问题:SmartX 的存储属于块存储吗?

回答:是的,SMTX OS 内置了 ZBS 分布式块存储软件,提供原生的块存储服务。

问题:社区版支持与 VMware 集成超融合的模式吗 ?

回答:不支持,商业版才可以支持,详细请查阅:社区版和正式版功能区别主要在哪里呀?

问题:社区版支持哪些客户操作系统,实体机如何迁移到虚拟机上?而 VMware 的虚拟机又如何迁移?

回答:主流的 Windows 和 Linux 操作系统都是支持的,具体可以看 SMTX OS 的兼容列表;从 VMware ESXi 迁移到 ELF (SMTX OS 内置虚拟化软件),我们提供了免费的 V2V 工具,可支持从 ESXi 在线迁移虚拟机到 ELF 上。

问题:VirtualBox 的虚拟机支持迁移到社区版吗?

回答:可以的,但对于 VirtualBox 的虚拟机,目前 SmartX 官方没有提供专门的 V2V 工具,但可以通过导入到平台后,通过内置的命令行工具进行格式转换,以及涉及一些手工操作,相对 VMware 的虚拟机操作上相对麻烦一些。

问题:社区版有(内置的)性能观测工具么?能观测到 VM 中卷的 IO (以及)在缓存盘和数据盘的分布(情况)及热点(数据)情况不?

回答:有的,系统内置监控报表功能,可以提供实时(历史数据分析需要商业版支持)的缓存命中率, 虚拟机的 IO 延时情况,IOPS 统计等。

问题:你们的分布式储存软件(SMTX ZBS)可以提供测试吗?

回答:SMTX ZBS 分布式存储软件商业版已经在 2021 Q4 发布,可以提供 30 天免费测试许可,但对应的社区版暂时还没有发布,预计会在晚些时候发布。

问题:社区版怎么申请永久使用?

回答:社区版安装完成后,可在管理界面获取系统序列号,凭序列号,访问 SmartX 官网,填入一些基本信息,即可申请永久许可。

许可申请页面:https://www.smartx.com/community-license/

问题:三个节点(3 台服务器组成的)集群可以跑两百多个虚拟机么?

回答:这个问题不能一概而论,集群能运行多少台虚拟机主要看服务器和虚拟机的资源配置,(满足 3 主机运行 200+ 虚拟机)单台主机运行 66 台虚拟机,相对来说属于密度比较高的情况。据实际经验,生产环境一般单台主机运行 20-30 个虚拟机,开发测试环境运行 50 台左右。

问题:SmartX 社区版有类似 VMware 的 FT 容错功能吗?

回答:SmartX 社区版没有提供类似 VMware 的 FT 容错功能。

问题:请问虚拟机软件(SMTX OS)是自己开发的吗?

回答:SMTX ELF 虚拟化软件是在 KVM 的基础上开发的,但自行开发了包括 HA、自动调度、高级监控等企业级的功能。

问题:请问服务器扩充硬件会影响 SmartX 系统运行吗?例如:加硬盘?加内存?扩展后软件需要调整吗?

回答:在线增加硬盘是不会影响系统正常运行的;添加内存操作需停机进行,如果希望避免影响业务,可以先通过在线迁移将需要增加内存的主机上的虚拟机到另外两个可用节点(前提是集群拥有三个节点,否则必须全部停机进行扩容),然后关闭节点进行内存添加,这样可以不影响业务正常运行;由于集群有节点离线,系统会自动触发数据恢复;服务器扩展硬件后不需要调整软件设置,同时也不涉及软件许可费用增加的问题(社区版免费,商业版本的许可是按 2CPU 节点为一个许可,跟内存、硬盘大小无关)

问题:SMTX OS 有专门的超融合管理节点吗?或者说有单个或几个管理虚拟机吗?CloudTower 有冗余吗,例如:主备虚拟机吗?如果是单台,那管理虚拟机挂了,客户不就无法管理了嘛?

回答:目前 CloudTower 没有提供主备虚拟机冗余的,但 CloudTower 虚拟机故障并不影响集群的正常运作,并且每个服务器节点本身已经有管理界面的,可提供应急管理平面。

问题:三节点集群,当有一个节点宕机后,上面的虚拟机重新在别的节点上拉起需要多久?

回答:SMTX OS 的 HA 触发时间是 3 分钟,当系统检测到节点宕机后,会在三分钟之内触发 HA ,虚拟机会自动迁移到其他节点并重新启动。

问题:如果主机故障(无法维修),更换的服务器与原服务器配置不同,会有影响吗?

回答:新更换的服务器首先得满足 SMTX OS 的硬件兼容性要求,在这个前提下,SmartX 集群是允许节点配置的不完全一致的,包括 CPU、内存、硬盘等配件不一致都是支持的。但一下情况需要考虑的。例如,集群内主机可以使用代数相近但型号不同的 CPU ,并可支持不同 CPU 之间的虚拟机迁移,但是如果 CPU 的年代相差较远,那么在线迁移功能也可能受到影响;另外,如果新增硬件相比原有服务器的性能是有所下降,也可能会导致集群性能的下降。

问题:请问超融合 3 节点(集群)如果都因为停电后(电力又恢复后)重启了,承载的虚拟机是按什么流程重启的,同时启动的话会不会造成设备超载?

回答:如果是集群所有节点都掉电,电力恢复后,虚拟机还是会在源主机上启动的,不会因为都迁移到一台主机上引起超载的问题。另外,如果是触发 HA 的情况下,虚拟机的启动是以随机的顺序轮流启动的,并不是所有虚拟机同一时刻启动的;启动顺序目前是不支持手工调整的,由系统决定。

问题:SMTX OS 要求硬盘直通,没有 RAID 保护,那么坏一个硬盘数据会不会丢啊?

回答:不会丢数据。因为 SMTX OS 的数据冗余不依赖 RAID 技术实现,而是通过多副本技术实现。当虚拟机写入数据,系统会根据存储策略自动写入 2 份或者 3 份,虚拟机本地主机有一份数据,远程主机有另外 1 份(3 副本下则有另外 2 份数据写入到另外两台不同的主机上)。这样的机制使得无论是遭遇单个硬盘故障还是主机故障,至少能在另外一个主机找到对应的数据副本可用,并可通过数据恢复自动恢复到预期级别,保障数据的可靠性。

问题:SMTX OS 主机中每块盘都是独立的吗?可以支持并发读写吗?

回答:SMTX OS 主机上的数据盘和缓存盘都是直通的,没有组建 RAID 组,因此可以理解是独立的。SMTX OS 无需专门的热备盘,多块数据盘和缓存盘支持并发读写。

问题:服务器故障需要一个恢复的过程吗,恢复期间能提供服务吗?

回答:当集群中有服务器发生故障,集群会将故障的服务器上面的 VM 通过 HA 功能自动迁移至其他可用的服务器节点上并自动恢复运行,同时会自动执行数据恢复,保障数据可靠性;而没有故障的主机上的虚拟机不受影响,整个数据恢复过程,系统会监控集群的负载情况自动调节恢复速度,最大程度保障现有业务性能和响应速度。

问题:能不能评价 EC 功能?相对主打 EC 功能的超融合产品,SmartX 的优势在哪里?

回答:RAID、副本、EC 这些都是数据冗余的保障手段,这些技术有各自的特点,以及不同的适用场景。例如 EC 它的机制与 RAID 5/6 差不多,通过多位校验算法,提高得盘率(节省空间),但同时消耗更多的计算资源,并且降低了 IO 性能。而副本技术更简单,性能好,但缺点是只有 50% 得盘率。而 SmartX 采用的是副本技术,并没有采用 EC 技术,主要考虑超融合的特征计算和存储是融合部署的(两者存在资源竞争的关系),数据冗余算法对 CPU 和内存消耗越低,那么主机更多的资源可用于运行虚拟机的资源就越多。而实际上 SMTX OS 的资源消耗基本上是业内最低,并且 IO 性能也是业内领先的水平。

如果大家对得盘率依然耿耿于怀,无非是对成本有更高的期望,那么我们可以细想一下,在混闪集群中,数据盘都是采用廉价的 SATA HDD,难道 CPU 资源不比 HDD 更加昂贵?EC 技术无非就是降硬盘的成本,但它需要更多的内存和 CPU 资源,在超融合环境下,代价可能更高。

问题:SMTX OS 缓存机制是 write back 还是 write through?一般是建议客户使用哪种缓存策略??

回答:SMTX OS 缓存策略是系统自动执行的,无需客户选择的。SMTX OS 缓存机制不属于传统的 write back 和 write through 机制,更准确地说是一种改进版 write back 机制,它既保留了 write back 机制的高效性能,同时有专门的机制应对突发断电引起的数据无法及时更新的问题。

问题:如果出现意外掉电等情况,是如何保证数据一致的?缓存盘的脏数据是否有脏数据保护措施么?

回答:缓存盘的数据实际上也有多副本保护,并且遵循强一致性的特点。另外,在系统遭遇意外掉电的情况下,系统将通过 Journal 的 IO 回放功能确保数据一致性。

问题:SMTX OS 集群中,使用 PMEM 与 NVMe SSD (作为缓存)性能上的差距应该不小吧?成本上的差异是否也是巨大的?

回答:两者性能差距是比较大的,SMTX OS 支持 Intel 持久化内存(PMEM)作为缓存,该方案下 IO 延时可低至 100us,3 节点集群 IOPS 超过 100 万(是 NVMe 的 2.5 倍以上)。PMEM 本身硬件成本上升并不算明显,但目前这个方案只提供一体机支持,并需要 SMTX OS 企业版许可;另外,存储网络也需要升级到 25G 以上的 RDMA 网络(推荐使用 100G RDMA 网络)。 方案主要应对一些对延时要求极高的应用。

问题:第三方认证走的是支持 LDAP 协议吗还是 OAuth?

回答:支持 LDAP,但当前社区版还未发布该功能,后续版本会加入该功能。

问题:单个虚拟机支持最大存储空间,有限制吗?

回答:虚拟机单个虚拟磁盘最大容量支持 64TB,如需要更大的空间可为虚拟机添加多块虚拟磁盘。

问题:SmartX 有云管平台吗?

回答:SmartX 目前没有自己的云管平台,当前主要和第三方云管平台进行对接,如 Fit2Cloud、骞云等。

问题:单机部署的情况下,存储盘没有冗余机制,存储盘得需要做 Raid 吧?

回答:单节点部署只可用于产品体验,不提供任何数据冗余保护,同时也不支持通过组 Raid 来代替副本保护。

问题:超融合可用于归档吗?

回答:SmartX 超融合属于计算和存储融合的部署架构,归档一般只需要存储服务,这种通常不太适合归档服务。

问题:超融合的 VM 在线迁移功能,走的是哪个网?

回答:SMTX OS 虚拟机的在线迁移默认通过存储网络执行迁移。

问题:为什么缓存盘还要 2 块呢?一读一写吗?

回答:SMTX OS 社区版支持配置一块/两块 SSD 作为缓存盘并不是因为需要去隔读和写缓存,每一块缓存盘都可以同时作为读、写缓存,配置两块 SSD 的目的主要是解决系统和缓存的高可用的问题。在实际使用中, SSD 故障是一个常见问题,而 SMTX OS 配置 2 块 SSD 作为缓存,可容忍任意一块 SSD 故障,另外一块 SSD 依然可以承担节点的缓存加速功能(只是缓存容量减少了)。另外值得注意一点:SMTX OS 缓存盘支持全局磁盘加速,并不是基于磁盘组做缓存加速。因此在单个 SSD 故障的场景下,缓存功能既不会失效,也不会引起部分数据存储空间下线的问题(磁盘组发生 SSD 故障,全组磁盘会同时下线)。

问题:如果 SMTX OS 集群里只有两节点,在节点都正常的情况下,能选举成功吗? 两节点集群下,挂一个节点后,可以不要求继续工作,是否支持?

回答:首先说明一点: SMTX OS 标准集群是 3 节点或以上的,社区版虽然可支持部署 2 节点,但仅用于体验(允许后续扩展为 3 节点),正式使用必须是 3 节点或以上的。当集群只有 2 节点,集群能正常工作,能选举成功,但不支持高可用。一旦 2 节点再挂 1 个节点,整个集群就无法提供服务。

问题:ZBS 是以哪个开源系统来二次开发的?

回答:SMTX ZBS 是 SmartX 完全自研的分布式块存储,不是基于任何一种开源存储做二次开发,核心完全自主可控。

问题:ZBS 的快照/克隆有限制吗?克隆卷是否能再克隆,嵌套深度有限制吗?

回答:SMTX OS 单个集群最大支持 100000 组快照,而单个虚拟机最大支持 1024 个快照(vSphere 单个虚拟机最大支持 32 个快照)。虚拟机克隆没有数量限制。

问题:如果集群有多个节点,每个节点存储容量都小于某个虚拟机的存储容量,但集群总存储容量足够进行数据恢复和多副本。在这种情况下,本节点宕机后,虚拟机是否能(通过 HA)自动恢复运行?

回答:可以恢复,虚拟机磁盘的容量由 SMTX ZBS 分布式块存储提供,即使每个节点的磁盘容量都小于当前虚拟机磁盘容量,但只要多副本之后的容量大于虚拟机磁盘容量就可以,只是会影响 I/O 本地化,当节点宕机时,虚拟机可以在其他节点拉起。

问题:如果要删除一个虚拟机的快照(100GB),是不是要保障虚拟机放置位置,至少还有多余的 100GB 空间,才可以执行?

回答:我们的快照本身是独立的,删除快照的时候,不需要额外占用空间。

问题:3 个节点组成集群,如这 3 个节点突然全部掉电了,当电力恢复后集群业务虚拟机会出现起不来的情况吗?

回答:SMTX OS 有专门的机制应对集群整体掉电的情况,通过 IO 日志重放的机制确保数据的一致性。当集群恢复电力后,集群将会自动恢复服务,开启 HA 保护的虚拟机也会自动启动。

问题:SmartX 本身是基于什么系统的?CentOS?有基于安可系统的版本吗?

回答:目前社区版本 SMTX OS 是基于 CentOS 基础上开发的。但最新发布商业版已经改为基于OpenEuler 操作系统。

问题:社区版开启 RDMA 有指导手册吗?

回答:社区版不支持 RDMA 网络,SMTX OS 商业版本可支持 RDMA 网络。

问题:请问社区版是否支持手动删除节点?

回答:社区版不支持删除节点操作。如需要对社区版集群进行硬件替换,可以新建一个 SMTX OS 集群,并通过 SMTX 迁移工具进行原有集群的虚拟机迁移到新集群,然后再对原有集群硬件进行调整并重组集群。

问题:快照可以保存多少个呢?

回答:单个虚拟机最多可保存 1024 个快照,单个集群最多可保存 100000 个快照。

问题:SmartX 的热迁移是怎么实现的?采用 post copy 还是 pre copy?如果是 pre copy, 针对脏页数据多时有明显的迁不动问题,你们有针对的优化处理的方案吗?

回答:并不是采用的 post-copy,而是采用 pre-copy + auto converge 的方式进行虚拟机热迁移。您提到的问题,主要是因为两个原因导致的,一个是脏页生成速度太快,另外一个是由于带宽不足,所以导致内存复制速度赶不上脏页的生成速度。我们专门为大内存虚拟机在线迁移做了优化:
1. 在线迁移默认会自动选择存储网络(要求 10G 或以上网络)执行以保证传输带宽。

  1. 针对大内存虚拟机,而且是比较繁忙的虚拟机,支持有一种自动调节功能,当脏页的生成速度过快,自动调整 CPU 降低脏页生成速度,直到生成速度控制在阈值以内,限制就会取消。(迁移过程中对虚拟机的性能是有影响的)

问题:SMTX OS 同城双活支持 Oracle 数据库么?

回答:支持的,SMTX OS 双活集群属于拉伸集群,支持将 Oracle RAC 集群跨数据中心站点部署,其共享的数据盘是完全同步的。

问题:SmartX 环境里,CPU 的超配比是多少?

回答:没有硬性的超分指标,CPU 超分的比例跟业务的类型和 CPU 负荷压力相关,很难一概而论。如果业务 CPU 负荷比较大,高比例超分将大幅增大 CPU 等待时间,性能也会显著下降。

问题:SMTX OS 集群部署选择分层和不分层有什么区别?

回答:社区版仅支持分层部署。

分层:

使用高速介质(SSD)做缓存,低速介质做容量(HDD),对于混闪(SSD+HDD)集群,必须使用分层部署。

不分层:

不设置缓存盘。除了含有系统分区的物理盘,剩余的所有物理盘都作为数据盘使用。对其全闪集群(SATA/SAS SSD、Nvme SSD)可选择分层或者不分层部署。

问题:ESXi 和 SmartX 虚拟化有什么区别?

回答:可以查看我们博客集合:VMware 替代合集 | 技术路线、厂商评估、技术分析与对比

问题:SmartX 超融合支持通过 iSCSI 协议,将存储空间开放给 VMware 虚拟机使用么?

回答:可以的。通过 CloudTower 界面在集群设置菜单中启用块存储服务,就可以把超融合的存储空间通过 iSCSI 提供给其他主机或虚拟机使用。

问题:超融合软件是固化在超融合一体机里面的么?

回答:SMTX Halo 超融合一体机预装了 SMTX OS 超融合软件,方便用户可以开箱即用;但超融合软件并不是以固件的形式固化在一体机硬件,用户可以方便地进行软件在线升级。

问题:以 NVMe SSD 支持 vSAN 或者 ZBS 会比 SATA SSD 的性能好多少?

回答:我们没有 NVMe 运行 vSAN 平台的相关数据。但针对 SMTX OS 有相关的测试对比:其中以 NVMe SSD 作为缓存的集群要比 SATA SSD 集群的性能更好,但同时需要更好的网络才可以充分发挥(一般 NVMe SSD 推荐搭配 25G 的 RDMA 网络),通常情况下能达到 SATA SSD 集群的性能 2 倍或以上,但在不同测试用例可能有所偏差。

问题:能用 VMware Workstation 来搭建测试环境么?

回答:VMware Workstation 一般装在个人 PC 上,内存和 CPU 的资源可能无法满足最低硬件要求,因此不建议在 Workstaion 上安装来体验我们的产品。关于社区版的硬件要求可参考社区专页:https://www.smartx.com/community/

问题:AMD 的处理器可以安装 SmartX 超融合吗?

回答:SMTX OS 支持 AMD 平台,具体支持型号,可以通过链接获取资料:https://www.smartx.com/resource/doc/general-hci/

问题:SMTX OS 对数据的保护是基于副本吧,那服务器硬件上还需要配置 Raid 卡吗?

回答:SMTX OS 上的数据是基于多副本技术提供数据冗余保护的,可支持两副本和三副本两种策略。服务器上既可不带 RAID 功能的 HBA 直通卡, 或者是使用 RAID 卡并设置为直通(JBOD)模式。

问题:超融合存储互联,有带宽的计算公式吗?与硬盘读写速度、IOPS 强相关吗?

回答:超融合集群中存储网络交换机的选用跟集群硬盘介质有一定关系,如果是部署混闪集群(SSD+HDD),存储网络至少是 10G 网络;如果是采用了 NVMe SSD 全闪集群建议使用 25G 作为存储网络,这样可以充分发挥 NVMe 性能。

问题:缓存的大小与数据盘的容量有对应关系吗?

回答:要求单节点缓存盘的总容量:数据盘的总容量要大于 1:10。如:单节点配置了 4 块 4TB 的 HDD 硬盘作为数据盘(数据空间为 16TB),那么该节点至少需要配置 1.6 TB 以上的缓存空间,可选择使用 2 块容量为 960GB (大于 1.6TB )的 SSD 作为缓存盘。

问题:部署超融合集群,交换机一般需要配多少台?6 台?

回答:在部署超融合集群时,一般划分为 3 组网络,分别为管理网络、存储网络、业务网络。这三组网络既可以分别接入三组不同的交换机,也可以是共用交换机(通过 vlan 隔离不同的网络),但前提是每一组交换机都是支持高可用(使用 2 台交换机配置堆叠或者虚拟化)。3 组网络完全独立的方案(高规格,隔离性好),每组由 2 台交换机组成高可用,那么是共需 6 台。如果考虑合并管理网络和业务网络在同一组交换机,存储网络独立的方案(常用规格,隔离性中等),则需要 4 台。

问题:超融合用的系统盘和缓存盘,一般是读取型,还是读写型?

回答:SSD 主要分读密集型、写密集型和混合密集型三种:读密集型 SSD 一般采用较低水平的配置,并使用相对不太耐用的闪存单元,具有较低的写入耐磨度,当然成本也会相对低廉。 混合型 SSD 相比读密集型更耐用,配置更大的替换数据块。而写入密集型的固态硬盘则是最昂贵的固态硬盘,其性能好,写入寿命比较长。具体使用那种硬盘,需要根据实际业务的需求,而超融合集群中的 SSD 通常作为缓存,写入操作是比较频繁的,考虑到性能和可靠性,建议是使用混合型或者写入密集型 SSD 作为缓存。

问题:SMTX OS 原生备份是不是 CDP?

回答:SmartX 的原生备份并不是基于 CDP 技术实现的,而是基于存储级别快照技术实现的虚拟机无代理备份,支持将运行在 ELF 平台上的虚拟机全量/增量备份到集群外部的 NAS 存储。此外,SmartX 超融合基础架构支持与 Zerto CDP 和 英方 i2CDP 等第三方 CDP 软件集成组建灾备解决方案。

问题:请问 SmartX 标准版支持通过 NFS 异地备份吗?我本地到异地专线只有10M 带宽可以支持吗?是备份整个虚拟机吗?我可以选择只备份数据吗?

回答:SMTX OS 标准版可以搭配 SMTX 备份与恢复组件,将虚拟机备份到异地的 NFS 存储设备。10M 的带宽可以支持,带宽高低会影响备份和还原的速度。SMTX 备份与恢复组件是对虚拟机进行整机备份,不提供数据文件的单独备份。如有文件备份需求也可以考虑第三方的备份软件。

问题:SMTX 迁移工具支持回迁吗?

回答:v2v 迁移工具,可以将 VMware 虚拟机或者 ELF 集群的虚拟机迁移到 ELF 集群,不支持回迁到 VMware 集群,但是如果是 ELF 集群可以支持回迁。

问题:SMTX 迁移工具是热迁移吗?

回答:SMTX 迁移工具支持将 VMware 虚拟机迁移到 SMTX OS 集群,迁移过程是在线进行,不需要对源虚拟机关机或停止业务;在迁移接近结束前,需要对源虚拟机进行短暂关机以完成对迁移过程发生变化的数据重新同步以及更新驱动等操作,完成后虚拟机就可以正常启动。

问题:医院的系统从物理机迁移到虚拟机,没有软件厂家配合的情况下,迁移成功率有保障吗?

回答:x86 有很多成熟的 P2V 工具,迁移成功率是很高的,一般是不需要厂商进行配合,但是如果软件和硬件强绑定且存在许可相关的问题,还是需要厂商支持的。

问题:如果从 Intel VMware 虚拟化平台迁移至海光 SmartX 虚拟化平台呢?兼容性有没有已知问题?

回答:目前我们可以通过 SMTX 迁移工具,将 VMware 集群的虚拟机迁移到 SmartX 超融合集群(基于海光信创硬件)。一般情况下,虚拟机迁移完成后可正常运行;但由于 CPU 平台改变,不排除有部分应用可能出现兼容问题,建议对应用程序做一些必要的检查和测试之后才正式上线使用。

问题:I/O 本地化之后,虚拟机执行在线迁移(到其他主机),相应的存储数据也会随之迁移(到对应主机)么?

回答:虚拟机迁移完成之后,不会马上执行 I/O 本地化,而是会跨主机读读取数据副本。后台会记录远程读取时间持续超过 6 小时后(确认不是一次临时的迁移),会自动将数据副本通过数据迁移的方式迁移到新主机,并在新主机上重新形成 I/O 本地化。

问题:部署 SMTX OS 时会校验缓存盘和数据盘是否存在坏道吗?

回答:一般情况下,部署过程中并不会提前校验 HDD 的坏道,或者 SSD 的寿命(SSD 没有坏道的概念)等信息。但部署过程中由于磁盘故障导致分区等操作无法完成,那么系统会提示相应的报错。实际上,在集群初始化完成后,系统会对硬盘进行监控,可自动发现慢盘(频繁出现 I/O 延时过大),坏盘(频繁发生 I/O error )以及剩余读写寿命较短的 SSD ,针对硬盘异常情况及时发出告警和隔离。

问题:SmartX 超融合通过快速克隆创建虚拟机,(其原理)是链式克隆吧?后台会异步断链成完整克隆的镜像吗?

回答:通过快速克隆创建的虚拟机,特性上有点类似链式克隆,但并不完全一样。快速克隆完成后,数据如果不发生变化,克隆出来的虚拟机与原有虚拟共享数据块,不额外占用空间。当数据发生变化后,克隆虚拟机会拥有独立的数据块,最终通常会与源虚拟机完全独立。

问题:主机断电重启后,有自动启动虚拟机的功能吗?

回答:有,需要开启虚拟机 HA 功能,开启 HA 功能之后,无论是当节点异常重启,还是集群重启,开机的虚拟机都会重新开机。

问题:双活集群下,优先可用域没有足够计算资源的情况下,会尝试在次级可用域拉起虚拟机是吧?例如:优先可用域有 3 个节点,故障了 1 个节点,但是剩余 2 个节点计算资源不足够。这个时候会在次级可用域的节点上拉起虚拟机吗?

回答:虚拟机开启了 HA 并且没有配置虚拟机放置组策略要求虚拟机必须在优先可用域中的主机运行的情况下,虚拟机在优先可用域计算资源不足的情况下,可在次级可用域中拉起。

问题:超融合节点配置多块硬盘组成存储池,会要求每块硬盘容量大小是一致吗?还是都可以?

回答:对于单块数据盘(HDD)不要求容量一致,但节点的总容量最好不要差距过大,否则容易出现数据分布过于集中于少数节点(或者容量较大的节点可以配置多于 2 台)。对于单块缓存盘的容量最好可以保持一致,其容量和性能不要差别太大,否则可能出现短板效应。

问题:CloudTower 不能同时管理社区版和正式版的,是吗?

回答:不可以,社区版 CloudTower 只能管理社区版的 SMTX OS 集群,商业版的CloudTower 只能管理商业版的 SMTX OS 集群。

问题:SMTX OS 配置双活延展集群以后,支持站点间的 DRS 和迁移吗?

回答:双活集群是可以支持站点之间在线迁移的,但前提是业务网可以支持大二层打通。此外,在双活的场景下虚拟机是有优先可用域的概念,虚拟机在优先可用域会有 2 个副本,另外一个站点有 1 个副本;数据读取会就近读取。因此也不建议在不同站点之间频繁迁移。

问题:SSD 缓存必须要 2 块 NVMe 的是吧?

回答:需要 2 块 SSD 作为缓存,但不一定是 NVMe SSD,SATA/SAS/NVMe 这几种 SSD 协议都是可以支持的。

问题:IO 本地化会带来的空间利用率/性能不均衡问题是怎么解决的?Nutanix 是通过移动少量的实时使用的 extent 来平衡,SmartX 是怎么做的?

回答:SMTX OS 也有内置的数据平衡功能,它会根据节点存储容量负载情况自动执行数据迁移,确保一定程度保持数据平衡。但数据本地化策略依然是优先的策略,当系统发现节点容量过高,它会优先尝试迁移非本地虚拟机非活跃的数据副本以维持数据容量均衡。SMTX OS 的数据平衡也是以 extent 为单位执行数据迁移的。

问题:社区版 SMTX OS 集群能否添加外部共享存储?

回答:社区版SMTX OS 集群属于超融合架构,内置分布式存储软件,无需接入外部存储。此外,目前社区版也不支持添加外部共享存储。

部署安装篇

问题:安装 SmartX 是不是最少需要两台服务器?社区版是不是两台其实也可以实现所有的功能?/SMTX OS 支持单节点部署吗?/单节点模式是只能运行社区版,还是所有的版本都可以?/集群必须要 3 台主机吗?可以 1 台吗?我看介绍说可以使用 1 台服务器的?

回答:SMTX OS 社区版可以支持 1~3 节点部署,但 1 节点和 2 节点 部署都有部分功能受限的情况,郑重提示:1 节点和 2 节点部署,只能作为功能体验,不可用于实际的生产环境使用),详细请参照下表:

对比项 1 节点部署 2 节点部署 3 节点部署
版本限制 仅社区版 仅社区版 社区版、商业版
在线迁移 不支持 支持 支持
节点高可用(HA) 不支持 不支持 支持
数据冗余/数据恢复 不支持 2 副本 2 副本、3 副本
分布式存储 不支持,仅本地存储池 支持,2 节点统一存储池 支持,3 节点统一存储池

问题:单节点部署需要多少张网卡?

回答:单节点部署,至少一块双口网卡,系统初始化的时候,依然需要一个网口绑定管理网络,一个网口绑定存储网络(虽然单节点部署下存储网络没有作用,但还是需要预留,可以不连线)。

问题:单节点部署,需要额外挂载集中式存储吗?

回答:不需要外挂集中式存储,SMTX OS 可将本地的硬盘资源组成存储池,缓存机制也是适用的,但单节点集群无法提供数据冗余保障(硬盘故障会引起数据丢失),因此仅用于测试。

问题:单节点(部署)也需要安装 CloudTower 吗?

回答:单节点部署也推荐安装 CloudTower,能获取更多功能和更优秀的体验。

问题:安装 SMTX OS 要不要创建 RAID?启动盘和缓存盘以及容量盘之间的关系是怎样的?

回答:SMTX OS 的磁盘种类有三种,分别是:启动盘、缓存盘、容量盘。其中启动盘仅用于存放启动分区信息,它可以是直通盘(如考虑高可用,可以使用 RAID 组);缓存盘和容量盘都必需是直通访问,不使用 RAID 组。其中缓存盘的用途是存放系统和元数据信息以及加速存储访问,缓存盘的空间不计入存储池的可用容量;而容量盘是实际存储数据的,存储池可用容量是各个容量盘之和。每台服务器的缓存盘的容量与容量盘的比例需要大于 1:10,例如:某节点的容量盘总容量是 10TB,那么缓存盘的总容量至少需要大于 1TB 。

问题:请教一下,SmartX 和 ESXi一起结合部署的时候,ESXi 是安装在预先规划好的指定的硬盘上或者几个指定的硬盘组合的 RAID 上是吧 ?

回答:ESXi 需要安装在单独的硬盘或者 RAID 组上,安装 ESXi 所在的硬盘必需是独立的控制器(必须与缓存盘、容量盘不在同一个硬盘控制器或者 RAID 卡上)

问题:业务网和管理网在同一个网络(子网)么?可以使用同一个网卡吗 ?

回答:业务网络和管理网络既可以是同一个子网也可以是不同的,同时也支持共用一块网卡甚至是共用一个网口。

问题:两台存储交换机建议使用什么模式?堆叠么?还是说在集群内选择主备模式后两台交换机之间不需要用光纤线连接 ?

回答:两台交换机高可用建议使用堆叠模式(也有厂家称为虚拟化模式或集群模式)。交换机不要用主备模式,因为超融合的存储网络的链路高可用不通过有多路径切换机制来实现(与 SAN 网络依赖多路径机制实现链路高可用不一样)。

问题:SMTX OS 支持海光 CPU 7 系吗?

回答:SMTX OS 商业版是支持海光 CPU 的,但社区版暂时不支持。

问题:部署 SmartX 超融合集群,网络交换机需要做什么配置?

回答:交换机一般都不需要做特殊配置,生产环境建议交换机做高可用(2 台交换机堆叠或虚拟化);另外,如果需要做基于 IP 的网络负载均衡,交换机配置 LACP,且在  SMTX OS 中设定绑定模式为 balance-tcp。

问题:社区版 ovf 部署方案在 ESXi 7.0 主机上可行吗?

回答:社区版 ovf 部署方案可以支持 ESXi 6.7 和 ESXi 7.0 。

问题:请问一下,部署 SMTX OS 集群是否可以刚开始使用一块 SSD 作为缓存,后面再扩另外一块?

回答:部署 SMTX OS 集群要求所有正式环境每个节点至少配置两块 SSD 作为缓存盘(同时承担系统盘作用), 2 块 SSD 可确保支持缓存盘和系统的高可用。如果在集群初始化的时候只配置一块 SSD 作为缓存盘,后续扩展至 2 块 SSD 可扩展缓存空间,但依然无法支持故障切换的功能。因此建议在集群初始化的时候就为每个节点配置 2 块 SSD。

问题: 请问数据盘的型号不同会有木桶效应吗?我现在数据盘都是 5400 转的,不知道有没有必要换到同容量的 7200 转的?

回答:分层模式情况下,数据盘(HDD )型号不同并不会产生木桶效应,性能取决于缓存盘(SSD)。5400 转的 HDD 磁盘通常是家用级别磁盘居多,性能和可靠性都不及 7200 转的企业级硬盘,建议更换为 7200 转的企业级硬盘。

问题:请问对于 SmartX 超融合来说,交换机应该怎么选?

回答:交换机选择上,如果是混闪集群,推荐使用万兆交换机作为存储网络,如果是全闪集群,推荐使用 25G 交换机作为存储网络,管理网络交换机一般使用千兆交换机,而业务网络可根据业务需求选择千兆或者万兆交换机。

系统安装篇

问题:我没有找到有关 SmartX 和 ESXi 一起部署的详细说明 ?

回答:社区版不支持与 ESXi 集成部署的模式,只有商业版才会支持的。

问题:安装 SMTX OS 需要传统 BIOS 启动吗?貌似 UEFI 启动不了,推荐 U 盘制作工具?在 Mac 上 有推荐的 U 盘制作工具吗?

回答:SMTX OS 既支持传统 BIOS 启动也支持 UEFI 安装的,光盘启动失败有时候跟 U 盘启动制作工具有关,这里推荐几个 U 盘启动制作工具:

Windows:https://rufus.ie/zh/

MAC: https://www.balena.io/etcher/

Linux:https://www.ventoy.net/cn/download.html

问题:SMTX OS 系统无法安装在可移动硬盘?PM8060 RAID 卡 在 HBA 模式下无法安装系统?

回答:SMTX OS 社区版不支持将系统安装在标识为可移动的硬盘上,这里有可能出现的情况有两种,一是磁盘确实是移动硬盘,另外一种是 RAID 控制器错误地将硬盘识别为可以移动硬盘。如果需要查看磁盘是否是可移动硬盘,可在安装 SMTX OS 界面,输入 ALT+F2 切换窗口,然后输入 lsblk 查看磁盘的状态,如下图:

lsblk.png

磁盘模式一列显示是 RM 代表 Removeable ,这种情况无法将 SMTX OS 安装在该盘上。如果是 RAID 控制器的问题请重新设置或者更换其他型号的 RAID 卡再尝试安装。

问题:在 ESXi 上嵌套安装 SMTX OS,初始化到 14 步时会失败?

回答:这种情况一般是因为默认情况下,ESXi 的虚拟机的 vdisk 是没有 uuid 的,这样会导致 SMTX OS 无法准确识别磁盘,导致安装失败。确认是否这个原因导致,可查看日志文件:/usr/share/zbs_deploy/zbs_host_

查找是否有类似这样的报错:Error: /dev/sdc: unrecognised disk label,如果是的话,可以按照以下操作解决:

1.关闭虚拟机.

2.进入这台虚拟机的编辑设置页面

3.进入高级设置.

4.进入配置参数

5.添加新一行参数名: disk.EnableUUID,设置参数值为:TRUE,并保存

6.重新启动虚拟机,重新执行系统安装.

问题:想咨询一下 安装 SMTX OS 系统时提示 could not open x display 是什么原因?

回答:这种情况一般是硬件不兼容的引起的报错,我们也会针对这类问题持续更新硬件支持,请留意 SMTX OS 社区版更新 。

问题:集群初始化时,到“检查配置”时提示前面的步骤有错?

回答:一般是设置和参数有误造成的,需要重新确认配置信息是否正确。例如:需重新确认缓存盘、容量盘是否选择合理,IP 信息是否正确等

问题:安装 SMTX OS 系统需要 2 块 SSD 吗?我看说明可以在同一块(SSD)上进行缓存和数据盘 ?

回答:最少需要一块 SSD(推荐 2 块)用做缓存盘,但容量盘是不能与缓存盘共用的,也就是一块磁盘不能既做缓存盘,同时也做数据盘。

问题:安装 SMTX OS 完成后重启无法进入系统 ?

回答:服务器有多块硬盘,安装系统后,有可能需要调整启动盘(boot disk)的顺序,把安装系统时选择的 boot disk 作为第一顺序启动,否则就可能导致系统无法正常启动了。

问题:我这边没有 DHCP ,怎么配置(初始化)平台?

回答:如果没有 DHCP,可以登录 SMTX OS 后台,然后手工设定固定 IP,设置完成后重启网络服务,即可登录集群初始化界面。

问题:SMTX OS 系统下如何配置固定 IP?如何确认网卡状态以及网卡的对应关系 ?

回答:访问 SMTX OS 服务器控制台(通过 IPMI 或者连接显示器和键盘) ,使用账号 root,密码:smartx 登录后台。

1.通过 ifconfig 命令列出所有活动的网口名称以及 MAC 地址信息,确认管理网口后,请记录网口名称,如下图中网口名称是:eno16

ip_configuration1.png

2.通过 ethtool + 网口名称,查看网口的连通状态,如下图中显示 speed:1000Mb/s,代表网口是连通状态,速率是千兆。反之,如果网口未连通会显示 speed: unknow!

3.管理网口确认后,通过修改网口配置文件设置固定 IP,输入命令: 
ip_configuration2.png

vi /etc/sysconfig/network-scripts/ifcfg-eno16 后,按照下图修改并保存:
ip_configuration3.png

4.输入 systemctl restart network 激活 IP 

问题:安装 SMTX OS 之前,如何清除硬盘中残留的软 RAID?

回答:大部分情况下可以选择不清理,直接安装即可。如需清理,可使用 SMTX OS 安装光盘启动,在安装界面中输入 Ctrl+Alt+F2 进入命令行界面后,通过 fdisk 或 wipefs 进行清理,清理后重新启动服务器再执行安装。

问题:为 SMTX OS 集群初始化时,其中一个全闪介质节点部署失败怎么办?

回答:社区版是不支持全闪介质节点的(商业版可支持全闪节点),因此会引起部署失败,请配置为混闪节点再执行部署。

问题:我部署了两次 everoute 都没成功,请问怎么排查问题?

回答:按照以下几点进行排查:

  1. 确认集群节点数量,节点数必须大于等于 3 节点;
  2. 每个 Everoute Controller 的 IP 地址与集群的 SMTX OS 管理 IP 之间必须连通;
  3. Everoute Controller 的 IP 地址之间必须连通。

问题:导入申请的社区许可,验证是正常的,但保存时提示“许可无效”怎么处理?

回答:通过虚拟机部署 SMTX OS 集群,不支持激活永久授权(但可试用 30 天),只有在物理裸金属服务器上部署 SMTX OS 集群才支持永久授权。

使用过程篇

问题:请问哪里有 Rest API 接口描述文档呢 ?

回答:API 文档集成在管理控制台,登录节点管理控制台,设置菜单中有 API 文档。

问题:社区版创建虚拟机安装 Windows 2016 系统时找不到可以安装的(磁盘)驱动,是需要调磁盘的格式吗?

回答:SMTX OS 的虚拟机默认使用 Virtio 磁盘总线,而 Windows 系统没有内置 Virtio 驱动,需要加载 Virtio 驱动进行安装。详细过程如下:

下载 Virtio 镜像:https://fedorapeople.org/groups/virt/virtio-win/direct-downloads/archive-virtio/virtio-win-0.1.185-2/virtio-win-0.1.185.iso

win20161.png

下载 Virtio 镜像,并上传到 CloudTower,虚拟机同时挂载 Windows 安装镜像和 Virtio 镜像,重新开始 Windows 安装,还是到了上图的位置(依然没有识别到虚拟硬盘),点击加载驱动程序,如下图,选择对应的文件夹
win20162.png

扫描后会显示如下图的驱动程序
win20163.png

成功加载驱动后就能正常识别硬盘大小了,然后就可以正常安装操作系统了。
win20164.png

问题:请解释一下 IDE 和 Virtio 两种总线的区别,对虚拟机的性能有没有差别?

回答:实际上 ELF 中的虚拟机可以为虚拟磁盘提供三种总线模式,其中 IDE 总线是全虚拟化的虚拟硬件,开销大,存储性能较差,但兼容性,无需安装驱动即可识别;而 Virtio 和 SCSI 这两种模式都是基于半虚拟化实现的 IO 虚拟硬件,开销小,存储性能好,但 Windows 操作系统没有内置 Virtio 设备驱动,需要额外安装驱动。推荐虚拟机使用 Virtio 或 Virtio SCSI 总线,这样性能更好。

问题:请问在 WEB 管理页面里的虚拟机列表菜单中能直接看到虚机的 IP 吗?需要怎么操作?

回答:需要安装 VM Tools 工具,安装后可支持虚拟机显示 IP 主机名等信息

问题:一台虚拟机无法改变分辨率,试过其他两种显卡类型也不行?

回答:这种情况应该是虚拟机没有正确安装虚拟显卡的驱动,可以通过安装 VM Tools 或者访问 Virtio 驱动镜像进行安装驱动,即可解决。

问题:社区版新建了个分布式交换机,无法删除?

回答:如果分布式交换机包含连接了已存在的虚拟机,是不允许删除的,如果要删除分布式交换机,需要将关联的虚拟机取消相关虚拟网络,以及手工删除虚拟网络后并确保分布式交换机上没有任何虚拟网络后,才能删除分布式交换机。

问题:SLB 的负载均衡模式都需要对交换机做什么配置?

回答:SLB 负载均衡模式是基于 MAC 和 vLAN ID 的负载均衡模式,无需交换机做设置,即可支持。如果选用 TCP 负载均衡模式,交换机则需要启用 LACP 功能。

问题:在管理界面卸载缓存盘的话,会影响下次启动吗?

回答:如果主机有 2 块缓存盘,是允许在线卸载缓存盘的,不影响下次启动,但是会触发数据恢复,因此不要随意卸载缓存盘,除非是缓存盘有故障警报或者损坏的情况。

问题:安装 Everoute 之后,在集群资源充足的情况下,CloudTower  为什么提示 HA 资源不足告警?

回答:因为在 3 节点集群上部署 Everoute,默认会部署 3 个 Everoute Controller,虚拟机分别放置在 3 个不同节点上,以确保 Everoute 服务的高可用。而触发该告警的原因是:系统发现当集群中任意 1 个节点故障, 该节点上的 Everoute Controller 本应通过 HA 功能在其他可用节点中恢复,但由于集群可用节点只剩下 2 个,无法保证 3 个 Everoute Controller 分别运行在不同节点,因此系统提示 HA 资源不足。在大于 3 节点的集群不会触发该报警,但由于社区版最大规模是 3 节点,因此一定会触发该告警,但不会影响日常使用。

问题:业务网口设置为 trunk 模式后,业务虚拟交换机找不到在哪里设置?

回答:当物理交换机对应端口配置好 trunk 模式之后,在集群中创建【虚拟分布式交换机】,关联对应的网口(调整为 trunk 模式的网口)。分布式交换机创建完成后,接着创建【虚拟机网络】,关联对应的虚拟分布式交换机,并设置 VLAN ID 和虚拟网络名称即可使用。

trunk.png

问题:CloudTower 上传 ISO 速度比较慢,有速度限制吗?

回答:当前 CloudTower 社区版(2.3.0)对上传 ISO 设置了限速(2M/s 以下),主要是防止上传过程中占用过多的带宽(如业务网络与管理网络共享带宽则有可能影响业务虚拟机网络访问)。新发布的版本其 ISO 上传速度将提升至最高 30M/s。

问题:在 Fisheye 上传的 ISO 镜像,为什么在 CloudTower 无法看到?

回答:Fisheye 属于 SMTX OS 集群应急管理平台,正常情况下 ISO 应该在 CloudTower 的内容库菜单中上传。在 Fisheye 上传的 ISO 信息无法同步到 CloudTower,需通过 CloudTower 重新上传 ISO。

问题:怎样设置副本数?副本数能否针对单独的存储卷设置?可以设置单副本吗?

回答:副本设置可在创建虚拟机时选择对应的副本策略。副本数可以针对虚拟机不同的虚拟磁盘分别进行设置。当前可支持的副本策略有 2 副本和 3 副本,但不支持设置单副本,主要因为单副本不具备任何数据冗余保护功能。

问题:虚拟磁盘大小为什么与虚拟机系统内显示的大小不一致?

回答:SMTX OS 虚拟磁盘容量的单位是 GiB(1GiB=1024MiB=1024*1024*1024 byte),而在操作系统内查询磁盘大小通常是以 GB(1GB=1000MB=1000*1000*1000 byte)为单位,因此导致两者显示的容量会不一致。

问题:社区版如何从 2 节点扩展至 3 节点?

回答:社区版推荐 3 节点部署,如前期资源比较紧张,可先进行两节点部署(2 节点集群不支持高可用),后续再扩容为标准的 3 节点集群(支持高可用)。扩容操作需在 CloudTower 界面上进行,扩容成功后需要执行后台命令进行角色转换(2 节点扩展至 3 节点必须的操作),详细方法可以在社区群咨询。

问题:SMTX OS 安装 Windows 虚拟机时需要加载 virtio 硬盘驱动,但 PVE 就不需要安装 virtio 驱动?

回答:PVE 在安装类型为 Windows 的虚拟机时,默认使用 IDE 磁盘总线,而不是性能更好的 virtio 总线(Windows 光盘中不带 virtio 驱动),因此,PVE 在安装 Windows 操作系统时并不需要额外加载 virtio 驱动。而 SMTX OS 安装虚拟机的时候默认会选用性能更好的 Virtio 总线,因此需要额外加载驱动。

问题:SMTX OS 虚拟机的文件格式是什么?

回答:SMTX OS 的虚拟机磁盘不是以文件的形式存在的,而是以虚拟卷(块设备)的形式存在。同时,SMTX OS 支持通过虚拟机磁盘文件以及 OVF 的方式进行导入。

问题:SMTX OS 平台测试过安装 debian9 么,安装系统后无法正常加载系统?

回答:SmartX 虚拟化平台 ELF 支持安装 debian9,但 debian9 对虚拟硬件有一定要求,磁盘需要选择 SCSI 总线,而虚拟显卡需要选择 VGA,这样就能正常完成系统安装并启动系统。

问题:如果要对集群进行维护、更换硬件需要进行什么流程?需要手动迁移虚拟机然后直接关机吗?开机后是不是等集群恢复了,再继续弄下一台?

回答:对节点进行硬件维护可以为节点开启维护模式(仅支持 3 节点或以上规模集群)后进行。SMTX OS 商业版可在 CloudTower 上操作,但社区版当前版本未支持该功能,需要手工执行以下步骤:

  1. 登录任意节点执行 sudo sh/usr/share/upgrade/upgrade_cluster/script/pre_check.sh,输出 pre check success 则预检查通过;如预检查失败,则需要根据提示处理之后再次进行检查;
  2. 将待维护节点上的虚拟机执行在线迁移至其他节点;
  3. 登录待维护节点,执行 sudo shutdown -h now,进行下电维护处理;
  4. 维护完成后,重新开启节点,等待集群状态恢复正常后(如有数据恢复,需等待数据恢复完成),回迁虚拟机;
  5. 如果有多个节点需要维护,需要依次按照前面的步骤执行。

问题:如何将社区版集群新加入的物理服务器转换为主节点?

回答:通过 CloudTower 添加节点成功后,需要登录到前面 2 个节点(添加节点前就存在)中的其中一个节点,执行 sudo zbs-cluster convert_to_master x.x.x.x 。x.x.x.x 指的是第 3 个添加的节点的存储 IP。

问题:Nutanix 的虚拟机中的 raw 格式磁盘如何导入到 SmartX?

回答:Nutanix 导出的 raw 磁盘,可登录 SmartX 节点管理页面 Fisheye,访问虚拟卷菜单,选择导入虚拟机磁盘;导入成功后,手工创建虚拟机并挂载已导入的虚拟磁盘即可。

nutanix.png

问题:CloudTower 有 API 文档么?

回答:有的,在线 API 访问链接(最新):https://code.smartx.com。社区版相关文档资料链接:https://pan.baidu.com/s/1Xy6uIcLtIygAidFdzVQLQA,提取码:yt0o。

问题:通过 Fisheye 创建的网络有办法更换为 CloudTower 创建的么?

回答:Fisheye 属于集群紧急管理页面,不应通过它去创建虚拟网络。日常操作应在 CloudTower 上进行。如果已经通过  Fisheye 创建了虚拟网络,可先将该虚拟网络关联的虚拟机移出,或调整到其他虚拟网络(该操作可能引起虚拟机网络中断)。清空虚拟网络后,可通过 Fisheye 界面删除该虚拟网络。然后再通过 CloudTower 新创建对应的虚拟网络,并将之前的虚拟机重新关联到该网络即可。

问题:CloudTower 的分组没法跟用户或者角色绑定么?比如一个组的人可以看到本组的机器。

回答:目前可以通过虚拟机分组去实现分组显示,也可以创建不同的管理角色。社区版后面也会加入 LDAP 用户的支持。

问题:在集群中卸载 SSD 的时间挺长的,是为了不影响集群所以限速了是吗?

回答:执行卸载 SSD 操作后,系统会将 SSD 的数据通过数据迁移的方式迁移到其他节点,同时系统会根据集群的负载情况对迁移进行限速,卸载时需要等待 SSD 上的数据完成迁移,因此持续时间会比较长。

问题:raw 的磁盘文件如何挂载到新的虚拟机上面啊,直接 convert 成虚拟盘吗?

回答:raw 格式的磁盘文件,可以直接在 Fisheye 虚拟卷界面进行上传,上传成功后,新建虚拟机,并选择该虚拟卷。

问题:第三方 KVM 平台中 Windows 虚拟机迁移到 SMTX OS 后,为什么控制台鼠标没有反应(但键盘可以输入)?

回答:可以查看是否有驱动冲突,一般情况是其他 KVM 平台使用了 usb-tablet 虚拟外设引起的。可尝试登录 Windows 虚拟机,在设备管理器中,卸载 usb-tablet 设备后再进行尝试。

问题:系统警告存储平均延时过大,一般要查哪些因素呢?

回答:触发存储平均延时过大警告一般有两个可能性:1. 某块磁盘(或者对应的磁盘控制器)发生故障了,导致访问延时增大,这种情况可以查看系统是否有磁盘健康相关的警告并作进一步的处理;2. 缓存空间比例过小,部分热数据无法在缓存命中。这种情况下可通过监控分析菜单查看集群的缓存命中率,如果缓存命中率持续偏低,则需要考虑扩展缓存空间。

问题:两个集群之间的 ISO 镜像可以共用吗?

回答:可以共用,如果当前这个集群上没有该镜像,通过内容库将镜像分发到对应集群,即可使用。

问题:安装了 VM Tools 之后,Web 控制台不支持修改某个虚拟机的系统密码吗?

回答:安装 vmtools 之后,在 CloudTower 中找到对应虚拟机的基本信息菜单,其中可以重置密码。如果没有该选项,请确认安装 vmtools 是否成功,或者 vmtools 版本是否过旧。

问题:SmartX 的时间同步是先由集群的 leader 与 NTP Server 通讯并同步,然后 leader 负责内部节点时间同步的机制吧? 那虚拟机迁移取的是硬件时间还是 SMTX OS 的系统时间?

回答:SMTX OS 的 NTP 服务可以应对两种场景:

场景1:

有外部 NTP 服务源的情况下,leader 负责与外部 NTP 服务器同步时间,然后集群中其他节点与 leader 进行同步进而确保整个集群所有节点的时间都是同步的。而在线迁移或者数据同步都会依赖这个时间的。

场景2: 

如果没有外部 NTP 服务器,那么 leader 不会跟外部进行同步,其他节点会跟 leader 同步时间,也可以保证整个集群的时间是一致的,但无法保证与标准时间是同步的。

问题:社区版从 3 节点扩展到 4 节点的操作为什么会失败?

回答:社区版许可单集群最大节点规模是 3 个节点,因此无法扩展至 4 节点集群。如需构建 4 节点或以上规模的集群可以选择 SMTX OS 的商业版本,版本之间的详细差异请查阅规格表:https://www.smartx.com/smtx-os/spec/

问题:新建了虚拟机,挂载了光盘,怎么不自动进入安装界面呢?

回答:如果是 Windows 虚拟机,并且是 uefi 的启动模式,没有在提示时间内按任意键进行安装,则会进入 uefi shell 。重启虚拟机,在提示时间内按任意键进入系统安装,或在刚开始启动时按 esc 键,然后进入 boot manager,选择 cdrom 启动。

问题:CloudTower 界面中的虚拟机 CPU 插槽对应的物理服务器是?

回答:物理 CPU 插槽和虚拟机的 CPU 插槽并没有一一对应的关系。如:一台物理服务器有  2 个 CPU 插槽(socket),每个 CPU 有 10 核(core),那么实际上就有 20 core 了,加上 CPU 超线程的功能,就可以在不超分的情况下变成 40 个 vCPU;而 40个 vCPU 是总数,具体可以分配到虚拟 CPU 插槽和虚拟 CPU 核数的乘积,如 4 vSocket x 10 vCore = 40 vCPU,也可以是 2 vSocket x 20 vCore = 40 vCPU。

问题:Windows 7 虚拟机设置了 1 核 8 插槽无法识别?

回答:Windows 7 操作系统属于桌面操作系统,不支持多 CPU 插槽,只能识别 2 个 CPU 插槽,这种情况下,可以将虚拟机从 1 核 8 插槽调整为 2 插槽 4 核,系统就能识别了。

问题:虚拟机执行一致性快照后,查看快照容量大小为 0,这正常么?

回答:SMTX OS 上的虚拟机执行快照后,如果虚拟机的数据没有发生变化,快照是不占空间的。当后面数据发生变化,快照的空间会随之增长。

继续阅读