内容导读

传统架构的扩容往往难度高且风险大,主要受制于集中式存储。超融合(HCI)将计算虚拟化和分布式存储进行一体化融合部署,与传统的“虚拟化+集中式存储”模式相比,不仅精简了设备层级和数量,简化了配置管理步骤,良好的弹性带来的按需投资能力也成为用户选择超融合的重要因素之一。

相比于业内大部分超融合产品,SmartX 超融合为用户提供了更加弹性、灵活的扩容选择。作为“软硬件解耦”技术路线的坚定实践者,SmartX 的超融合软件适用于主流品牌的服务器,且支持多种主流硬件的兼容。特别是对于由通用机械盘或 SSD 构成的存储资源池,SmartX 的存储管理和 I/O 加速技术表现得更为灵活,允许用户以更大自由度选择服务器和相关设备组件进行扩容。SmartX 超融合提供了以下资源扩容方式:

  • 在线添加节点内的存储设备。
    • 存储扩容的颗粒度细化,即便只增加 1 块 HDD 或 SSD,也能被顺利融入整体资源池。
    • 采用冷、热数据自动分层模式下,缓存层和数据层可分别扩容,支持在线添加、替换存储设备。
    • 对于采用全闪盘的集群,支持“不分层”模式,提高高性能存储设备的利用率,所有 SSD 均可在线添加和替换。
    • 扩容后的数据存储在不影响业务的情况下自动均衡,无需人工干预。
  • 在集群内在线添加节点扩展计算和存储资源。
    • 同一集群内,支持由不同品牌、不同型号和不同存储配置的服务器组成资源池。
    • 扩容后的数据存储在不影响业务的情况下自动均衡,无需人工干预。
  • 通过多集群管理平台 CloudTower 实现更大范围的资源池建设和统一管理。

以下,将详细介绍对集群中的存储资源进行扩容时的要求和注意事项。

SmartX 超融合存储资源配置和扩容方式

SmartX 超融合集群中,每台服务器对本地盘(HDD 和/或 SSD)配置的最低要求如下:

表格一.png

集群中应包含至少 3 台如上表配置的服务器,这是最小规模的超融合集群。如果在 SmartX 超融合集群中需要更多存储和缓存容量,可以有以下几种扩容方式:

1.增加节点上的数据盘和缓存盘

在集群的任一节点上新增任一块硬盘作为数据盘,该硬盘的容量都将被加入集群的存储资源池。

  • 允许每个节点上存在不同容量的硬盘、允许集群上存在硬盘总容量不同的节点,SmartX 分布式存储技术可以智能调节各个节点、每个数据盘上的存储量,以达到节点和硬盘上的存储量平衡。
  • 出于存储性能考虑,推荐各个节点上所有数据盘使用同样性能的产品(比如:同为 7200 RPM 的机械盘)。
  • 推荐各个节点上所有用作缓存的 SSD 也使用具有同等性能和耐久度的产品(比如:同为 IOPS=50,000 且 DWPD=3 )。

在完全基于新购硬件搭建的集群上,很容易做到所有服务器节点上使用型号和容量完全一致的硬盘。但实际情况是,很多用户需要在已有集群上进行扩容,或利用旧服务器重新搭建集群。这就不太容易在所有节点上实现硬盘的完全一致性。SmartX 通过自研的存储管理和调度技术,可以弥补节点上的硬盘型号和容量的差异化,在硬盘资源层面上实现“异构”。

添加节点上的数据盘时,需要注意以下三点:

  • SmartX 超融合集群中,每节点所有数据盘之和不能超过 80 TB。
  • 缓存盘与数据盘的容量比例不应低于 10%——如果增加了数据层硬盘的总量,则有可能需要相应地添加/替换缓存盘。
  • 单节点最多支持的缓存层总容量为 16 TB。

在每节点上的缓存盘和数据盘都有冗余保护的情况下,可通过管理界面的配合操作,进行逐盘在线替换,不会导致存储的数据丢失或服务中断。

2.在集群内增加节点数量

在已有的超融合集群内添加更多服务器节点,则可以同时增加集群内部的 CPU、内存和存储资源。或者,如果单服务器节点内部的硬盘已经无法继续扩容,也可以通过在集群中增加节点的方式来进行扩容。

如果同一集群内的服务器型号及组件能够做到完全一致,当然会具有更好的性能和可维护性。但很多用户在对已有集群扩容时已经无法购买到原有的服务器或组件型号,不得不考虑在集群中混用各种服务器的可能性。如前所述,SmartX 超融合在自动化智能平衡各个节点、各个硬盘的存储资源方面可以提供有效的方法,因此可以支持将不同型号和配置的服务器组成“异构”集群。

对新加入集群的服务器,如果不能与集群中现有节点保持完全一致的配置,至少应符合以下要求:

  • 必须与原有服务器采用同样的 CPU 架构,但不强制要求使用同样品牌的服务器。
  • 所有相关组件必须符合 SmartX 硬件兼容列表的要求。
  • 节点上本地存储设备(HDD 和/或 SSD)组成结构(“全闪”或“混合”、“分层”或“不分层”)应与现有集群内的服务器保持一致,但不要求使用同样的型号和容量的存储设备。

注:SmartX 支持的 CPU 品牌为:Intel、AMD、鲲鹏、海光。SmartX 支持的主流服务器品牌为:戴尔、联想、超微、惠普、华为、神州数码、浪潮、新华三、中科可控、超聚变。

用户可以不断向集群内添加新的服务器硬件来扩充集群规模。新服务器硬件往往具备更高的性能和容量密度。

3.多集群统一管理和虚拟机迁移

SmartX 超融合软件 SMTX OS 单集群最大支持 255 个节点,最大存储裸容量 6PiB。但在单集群中配置很多节点和存储资源,势必会增加管理复杂度;而且用户往往希望基于业务的类型划分不同资源池或希望控制集群规模,降低单集群内多节点同时出现故障的风险,那么扩展为多集群是很好的选择。多个超融合集群可以通过 SmartX 管理平台 CloudTower 进行统一管理,实现可持续横向扩展,来提供更大的资源池,而不受单一集群节点数限制。

CloudTower 可以在一个集中的管理体系内,通过分集群管理,缩小每个集群进行维护操作时的影响范围,实现集群服务水平的提升。

虚拟机可以在 CloudTower 2.0 统一管理的多个集群之间进行迁移。在不同场景下,可以提供热迁移、分段迁移、冷迁移三种模式,详见《SmartX 发布管理平台 CloudTower 2.0 版本》。

不同超融合厂商的扩容方式对比

不同超融合厂商的技术体系和具体实现方式不同,在进行超融合集群扩容时,面临的选型和限制也不相同。下表对比了 SmartX 与 VMware 在超融合集群扩容方面的异同:

表格二.png

对比小结:

  • vSAN 集群中的服务器节点如果不满足盘组一致性、节点一致性要求,会导致集群整体 I/O 性能下降严重,因此 vSAN 集群设计都是以硬件一致性为前提;虽然集群可以短时间内运行在不一致的硬件配置上,但无法以此支持生产级的性能和可靠性。
  • 基于 SmartX 超融合构建的集群则为用户提供了多样化存储扩容的选项,并且得到了实际生产环境的验证。

灵活扩容背后的 SmartX 分布式存储技术

SmartX 超融合的弹性灵活扩容,很大程度上来源于 SmartX 分布式存储技术的实现机制。它基于自主研发的分布式文件系统 LSM,将服务器上本地硬盘( SSD + HDD)资源进行池化。虚拟化存储资源池通过 SmartX 研发的元数据组件进行管理,元数据记录了集群所有节点本地硬盘资源的信息,使得超融合集群中的存储资源调配可以做到更加细粒度、更加精确的控制。这种控制的优势一方面体现在性能方面,另一方面体现在集群的灵活性,如副本分配策略的调整、副本存放位置的选择、数据保存以及 I/O 访问本地化、节点间数据平衡的控制等。

这些特点加强了超融合服务器上的存储资源的灵活性,提高了对不同服务器节点、不同硬盘容量的综合调度能力。集群规模只需 3 个节点起步,IT 运维人员可以在工作时间插入和添加新硬盘,即可完成存储资源的扩展;也可以在不停机的情况下添加服务器节点,同步扩展计算与存储资源,后台将自动地完成资源的池化和平衡,使得资源可以实现“即插即用”。

用户案例

目前,已有越来越多的用户,在实际部署环境中充分利用 SmartX 超融合的灵活扩展能力,不仅实现了资源池的按需投资和扩展,同时通过灵活的选择获得最优的方案配置。

以五矿期货某超融合资源池的硬件扩容与替换为例,从最开始的 4 节点纯软件(基于 SmartX 原生虚拟化 ELF)逐步扩容到 10 节点,先后使用过的服务器类型包括超微四子星、PowerEdge R740xd、PowerEdge R730 。在整个过程中,五矿期货在保障业务“0”中断的情况下,在集群扩容的同时完成了对部分服务器的升级替换。五矿期货的 5 个数据数据中心内的 7 个集群,也通过 CloudTower 实现了跨地域统一资源管理。可阅读《五矿期货超融合硬件平滑升级与多数据中心管理实战》了解详情。

点击下载 SmartX 超融合基础设施及 SMTX Halo 一体机产品介绍