随着超融合的应用场景从边缘向核心转移,HCI 厂商正在寻求通过升级硬件等方式获得更高的性能、更低的延迟以及更好的可靠性。在外媒 Blocks & Files 发表的《关键应用和超融合基础架构:时机已到》一文中,作者 Daniel Robinson 认为,虽然 HCI 早期主要用于构建支撑虚拟机的基础架构,但是随着技术的进步,HCI 已经能够支持关键应用工作负载。借助英特尔最新的计算和存储产品,HCI 可以提供足够的 I/O、低延迟和可靠性,以支持企业应用程序及其数据库。

事实上,在超融合系统升级的同时,硬件本身也在升级,二者相互驱动为客户带来极致性能。例如,英特尔近日推出的英特尔®第三代至强®可扩展处理器以及第二代英特尔®傲腾™持久内存等技术,专为人工智能和数据分析工作负载而进行了全面优化。这些优化能够进一步提升 HCI 架构在性能、容量、延迟等方面的表现,有效支持机器学习等人工智能工作负载。

基于独特的计算和存储融合部署模式,超融合系统可以全面利用英特尔的计算和存储创新进行产品增强。以英特尔®傲腾™技术为例,其分为固态盘和持久内存两种产品形态,在持久内存形态下,进而可以分为内存模式和 App Direct 模式。SmartX 不仅增加了对傲腾™持久内存的支持,为单节点虚机密度带来提升。同时在新一代超融合解决方案中,在业内首次将英特尔®傲腾™持久内存以 App Direct 模式,作为存储加速核心组件用于超融合解决方案中,在 IOPS、带宽和时延方面带来大幅改善。

以下内容,对文章原文进行了翻译与整理:

超融合基础架构 (HCI) 在经过十余年的发展后,行业对其需求仍在快速增长。IDC 相关数据显示,2019 年第四季度,超融合系统的营收同比增长 17.2%,而整个服务器市场的增长仅为 5.1%。

尽管很多通用工作负载已经在 HCI 上部署,但一些 IT 部门仍对使用 HCI 处理任务关键型企业应用程序持谨慎态度。现在,借助英特尔最新的计算与存储技术,HCI 能够提供足够的性能、可靠性、灵活性和可扩展性,来满足关键应用负载需求。

HCI 通过基于类似设备节点的模式为基础架构提供组件,从而使运维人员能够通过添加更多节点或磁盘来进行扩展。每个节点能将计算、存储和网络集成到一个模块中,这与必须单独提供和配置的组件形成了鲜明对比。

在软件层,HCI 价值巨大。它能够虚拟化一切内容,并使用跨节点集群的集合存储资源来创建软件定义的存储池。这样的软件层便于集中管理,提升了自动化程度,帮助 IT 专业人员更轻松地部署和管理 HCI。

传统 SAN存储模式

企业应用程序,例如客户关系管理(CRM)、企业资源规划(ERP)以及专为联机事务处理(OLTP)设计的应用程序,一般在数据库后端来存储和检索信息。通常,使用 Oracle 或 SQL Server 之类的数据库系统能满足要求。

传统方案中,数据库在专用服务器或服务器集群上运行,以便处理大量数据交易,并在一台服务器出现故障时,支持故障转移。而存储则由专用存储阵列提供,该阵列通过 SAN 链路连接到服务器集群。设计该体系结构是为了提供能满足数据库和使用该数据库的应用程序要求的 IOPS 性能。

但是,这意味着数据库和部分应用程序实际上被锁定在自己独立的基础结构中,并与其他 IT 资产分开管理和更新。如果一个组织里有多个应用程序孤岛,数据中心管理将极其复杂,同时也将影响 IT 基础架构向灵活和适应性更强的方向优化。

另外,它的出现远早于固态硬盘(SSD)的引入。固态硬盘的读写带宽容量比机械磁盘高得多,并且延迟低得多。例如,单个英特尔® 8TB SSD DC P4510 系列设备随机读取能够达到 641,800 IOPS。

这种优势一部分来源于固态介质自身,以及较新的 SSD 使用 NVMe(作为驱动器和主机之间的协议。NVMe 通信协议是专门为固态介质创建的,使用高速 PCIe 总线提供比传统接口(如 SAS)更大的带宽,同时支持多个输入输出队列。NVMe 协议还可确保不会因为软件堆栈中的延迟而影响性能。

软件定义模式

通过 HCI,数据库可以在虚拟机上运行。软件定义的存储层意味着存储分布在整个节点的集群中。集群中的每个节点都服务于 I/O,随着主机数量的增加,基础架构的总 I/O 能力也会增强。

此分布式模型的好处还有,如果节点出现故障,性能和可用性不会受到太大影响。大多数 HCI 平台现在还具备企业存储阵列的诸多功能,例如快照和删除重复数据,而内置数据保护功能使灾备恢复工作更加轻松。

随着技术的进步,例如新一代英特尔®至强®可扩展处理器,每个芯片通常具有比上一代更多的 CPU 内核。随着运行集群工作负载所需的节点数量减少,成本也相应下降。

但是,由于主机的数量决定总 I/O 容量,这种整合可能会减少集群的总体 IOPS。幸运的是,SSDs 拥有足够的 IOPS 来避免这种下降,尤其是英特尔® 傲腾™ DC SSDs,这类固然硬盘专为最苛刻的工作负载提供所需的 IOPS。

缓存层优化

在 HCI 平台中实现分层存储的做法非常常见。在集群中的每个节点内,将一个驱动器作为缓存设备(通常是SSD),而分配其它驱动器为容量层。过去,容量层一直使用机械硬盘,但是如今,容量层也可以是 SSD。

在此配置中,缓存层有效地接收了主机系统上运行的每个虚拟机的所有写入,这说明为它指定延迟极低且耐用性非常高的设备至关重要。换句话说,你需要一个不会“停顿”的设备,因为这些额外的 CPU 内核已经被投入使用。

英特尔®傲腾™ SSDs 符合这些要求,因为英特尔®傲腾™使用的技术与其他 SSDs 使用的 NAND 闪存完全不同。英特尔®傲腾™SSD DC P4800X 系列等当前产品的读写延迟为 10 微秒,而典型的 NAND 闪存 SSD 的读/写延迟为 77/18 微秒。

在耐用性方面,英特尔声称,在五年内具有每日三次整盘写入(DWPD)的半 TB 闪存 SSD 可提供 3 PB 的总写入量。375GB 傲腾™ SSD 在同一时期具有 60 DWPD 的耐用性,相当于总写入量为 41 PB,比传统 NAND 的耐用性增益提高约 14 倍。

存储的容量层可以满足大多数读取访问的需求,因此可以由容量更大但成本和耐用性较低的 SSD 组成。英特尔第二代 3D NAND SSD 基于 QLC 技术对读取密集型工作负载进行了优化,是当前需求的理想选择。

此外,英特尔®傲腾™ SSDs 效率更高,IT 部门可以借此减小所需的缓存层大小来节省成本。据了解,由于英特尔®傲腾™的性能和低延迟等特点,缓存在容量层的占比从 10% 降低到 2.5% 至 4%。这意味着现在客户可以使用 375GB 英特尔® 傲腾™ SSD 满足以前一个 16TB 容量层的要求。

内存容量提升

英特尔®傲腾™是按字节访问的,即以内存的方式而不是块存储访问。这意味着它可以扩展系统的内存容量,提高涉及大型数据集(如数据库)的工作负载的性能,并且与 DRAM 相比成本更低。

为此,英特尔提供傲腾™持久性内存模块,这些模块可插入基于第二代英特尔®至强®可扩展处理器系统的 DIMM 插槽中。这些模块与标准 DDR4 DIMM 一起使用,但容量更高,高达 512GB。模块的延迟高于 DRAM,但闪存延迟比例非常小。

傲腾™内存模块有两种主要使用方式:在 App Direct 模式下,它们显示为 DRAM 旁的永久内存区域,需要应用程序感知两种不同类型的内存。在内存模式下,CPU 内存控制器使用 DRAM 缓存傲腾™内存模块,这样它对应用程序而言是透明的,应用程序只感知到更大的内存空间。或者说,App Direct 模式提供了一个持久的本地存储,用于放置经常被访问的信息(如元数据),而内存模式只是将傲腾™作为更大的内存空间。

总结

虽然 HCI 早期主要用于构建支撑虚拟机的基础架构,但是随着技术的进步,HCI 已经能够支持关键应用工作负载。借助英特尔最新的计算和存储产品,HCI 可以提供足够的I/O、低延迟和可靠性来支持企业应用程序及其数据库。

原文链接:
https://blocksandfiles.com/2020/06/11/mission-critical-computing-and-hci-the-time-has-come/