作者:SmartX 产品经理 周扬

许多企业在考虑部署超融合架构时,会倾向于采用灵活的硬件搭配而不仅仅局限于一个品牌。SmartX 超融合解决方案提供 Halo 一体机和 SMTX OS 纯软件两种交付模式,能够更好满足不同用户的需求。

《SMTX OS 硬件选配推荐指南》(以下简称《指南》)专为选择 SMTX OS 软件解决方案的用户制作,从专业角度介绍了为 SMTX OS 配置硬件时需要考虑的项目和指标,能够帮助用户结合自身情况,选择更为适合的硬件产品,让超融合硬件配置更轻松。

《指南》包括单机硬件配置、硬件资源预留方案和扩容选择三个版块。前几期中,我们已经介绍过单机硬件配置的大部分内容(CPU、内存、SSD和HDD、存储控制器及网卡),本期是《指南》摘选的终结篇,为大家带来的是《指南》最后三部分:单机硬件配置中的服务器选择、预留硬件配置选择和扩容硬件配置选择。

如果希望获取完整《指南》,可扫描文末二维码进行下载。

单机硬件配置:服务器机型选择

服务器机型选择

目前做超融合主流机型分为1U1N(1U1 节点)、2U1N(2U1 节点)和 2U4N(2U4 节点、四子星)。

1.2U1N 服务器

2U1N 服务器在 2U 空间内基本达到了性能、扩展性、稳定性互相平衡的极致,因此也成为在各个厂商也基本都为的拳头产品,出货量最大,也最稳定,如 Dell R740/740xd、Huawei 2288H v5、HPE 380Gen10 等。所以 2U1N 服务器也是我们优先推荐的服务器类型。

2. 1U1N 服务器

1U1N 服务器的诞生是基于对服务器密度的考虑。若服务器机柜的供电与承重不成问题,单机柜内 1U1N 服务器的部署密度是 2U1N 的两倍。但提升服务器密度的同时,势必会牺牲服务器的性能与扩展性,比如 1U1N 支持的硬盘和 PCIe 设备数量会比 2U1N 少 1 倍以上。所以要结合密度与扩展性灵活考虑 1U1N 方案。

3.2U4N 服务器

2U4N 服务器的一个主要应用场景就是超融合,因其在 2U 空间内可以部署 4 台双路服务器,成为一个小的集群,集成度较高。但因为 4 个节点会共享如硬盘背板、电源板、电源模块等部件,会存在共享模块损坏,一个机箱节点全部宕机的风险,所以推荐用户使用 2U4N 方案时,尽可能保证保证集群大于一个机箱并配合SMTX OS的拓扑感知功能进行跨机箱的数据分布。

另外,由于 2U4N 服务器密度较高,散热能力相对不如 2U1N 服务器,建议配置 TDP 165W 以下 CPU,若有高 TDP CPU 需求,建议选择 2U1N 服务器。

2U1N 与 2U4N 一般参数对比


Optional-final 1.png

注:此参数为一般参数,不代表某个具体机型;2U4N 参数为单节点参数(外形及电源除外)。

服务器机型总体推荐情况:

  • 2U1N:可以带来更好的性能及扩展性。
  • 2U4N:可以提供更高的部署密度以及集成度,交付部署速度快。

预留硬件配置选择

客户应根据实际应用需求给出配置资源的需求量,在客户需求基础上,首先要为 SCVM 预留 6 个线程,一般为 3 个物理核,以及 16 G 内存。

其次要为最大节点硬件资源预留故障迁移空间。如集群内有 3 台物理服务器 A、B、C,若服务器 A 的 CPU 核数最高为 24 核,那么 B 和 C 服务器就要预留出 24 核的空闲 CPU,当服务器 A 故障时,可以将虚机迁移至 B、C 服务器。对于内存资源、硬盘资源也是同样道理。当然,每个虚拟机的配置可能都会不同,要根据客户实际的应用需求进行考量。

扩容硬件配置选择

集群硬件扩容时,不必一定选择同品牌、同型号的服务器,选择相同品牌、型号的服务器只是可以让后续硬件运维更加简单。从超融合软件角度考虑,x86 服务器硬件对于软件层近乎透明,一个集群中可以兼容不同品牌、型号服务器,但最好确保扩容节点的整体性能不要低于原集群内节点。

对于硬件产品平台切换、更新迭代等情况,如集群内原 CPU 为 v4,若扩容添加第二代 Intel®️ Xeon®️ Scalable Processor,可以参照如下建议。

扩容 CPU 推荐

若需推荐 v4 CPU 升级至第二代 Intel®️ Xeon®️ Scalable Processor 所对应的型号,可以参照以下表格。基本每种 v4 CPU 都对应两种不同型号的第二代 Intel®️ Xeon®️ Scalable Processor,Efficient 代表内核、主频参数基本一致,Comparable 的整体性能会更优一些,扩容服务器节点配置 CPU 的基本原则是要保证内核数与主频大于等于原集群内的服务器节点。Optional-final 2.png

若需更全面的 CPU 型号推荐信息,可以访问链接:https://xeonprocessoradvisor.intel.com ,示意如下:Optional-final 3.jpg

扩容数量与容量

具体扩容的服务器数量和容量要以客户应用新增的资源需求为依据,内存与硬盘最好配置相同型号、类型。若无法 100% 达成,内存可以优先保证频率和单条容量一致。SSD 要尽量选择同系列。若 SSD 型号停产升级,如 Intel S4600 升级至 S4610,可选择同系列升级后的型号 S4610。但由于 S4610 性能优于 S4600,所以集群性能可能会被低性能部件所影响,达不到高性能部件的峰值性能。如果同系列无法达成,建议配置相同类型的 SSD,即原集群为读写混合型 SSD,扩容节点同样配置读写混合型 SSD,并确保扩容配置的 SSD 性能要大于等于原集群内配置的 SSD。

HDD 尽量选择接口、转速一致或优于原配置的 HDD。

对于磁盘容量,一个集群内不同节点需要尽量保持一致,并确保一致的 SSD 与 HDD 总容量配比。如原集群内服务器节点配置了两块 480G SSD、四块 2T HDD,扩容节点也要尽量保证与此 SSD、HDD 的配置方式相同。若的确需要扩容较多存储容量,建议扩容多台服务器或将原服务器单机配置也进行扩容。若在扩容之后节点间存储容量能力不均衡,可能会产生压力聚集的现象,例如集群内某个节点的 HDD 为 30TB,其余节点的 HDD 均为 10TB,它们保持了接近的一致 Cache 配比,节点存储数据的访问频率和节点的容量是强相关的,在业务量足够大的情况下,30TB 的节点会承担超过其他节点的访问容量,存储的访问压力会集中在这个节点上,对这个节点的 CPU 和网卡都会带来比其他节点高的多的压力。集群的整体性能会因为单一节点的过载现象而下降。这种场景下 30TB + 若干 10TB 的容量组合能够提供的最大性能会低于若干 15TB 组成的集群。

扫描下方二维码,可下载完整《指南》。

Optional-final 4.png

了解更多产品信息,请点击:https://www.smartx.com/smtx-os/