众所周知,使用基于标准 x86 与 ARM 等通用服务器平台的软件定义架构,是超融合能够全面提升用户 IT 架构敏捷性和易维护性的一个重要原因。相比于使用专有硬件的传统 SAN 存储,这种架构的一大优势就是可以在产品中快速引入业界最先进的数据中心相关部件,从而大幅提升产品能力。

作为业内领先的超融合厂商,SmartX 和全球知名硬件厂商始终密切配合,力求将业内领先的硬件技术快速应用于超融合产品。

近期,SmartX 和 Intel 中国基于 Intel 第二代至强可扩展处理器平台与 Optane SSD 结合 SmartX 超融合软件 SMTX OS 进行产品联合验证,并在 Oracle 等 IO Queue Depth 较低的场景中充分验证了 Optane 技术在存储性能、时延等方面带来的大幅改进。

Optane SSD 架构特点概述

optane-ssd.png
注: Intel Optane P4800X 图片来源于 Intel 产品手册[1]。

Intel Optane SSD 基于 3D XPoint 技术,读写速度更接近于 DRAM,而存储空间与 NAND SSD 相当。相较于 NAND SSD,Optane SSD 具有高吞吐、低延迟、高 QoS 和极高寿命的特点,在数据存储中非常适合作为 DRAM 和低速 SSD/HDD 之间的缓存。

本文的评测对象是 Optane P4800X。Intel 官方产品手册[1] 提供的数据如下:

  • 高吞吐:Optane P4800X 在 queue depth 为 11 时 IOPS 可以达到 500k(~2GB/s),而一般的 NAND SSD 都需要更高的 queue depth 才能达到其峰值,例如 32(SATA)和 128(NVMe)。
  • 低延迟:Optane P4800X 在 2GB/s 随机写背景流量的场景下,仍然有稳定的读响应时间,时间低于 30us。
  • 高 QoS:Optane P4800X 在随机写背景流量场景下,99% 的读响应时间比 NAND SSD 低 60 倍。
  • 极高寿命:Optane P4800X 非常适合具有大量写操作的场景,每日写入量高达 30 DWPD(JESD219 workload),750GB 容量的 P4800X 总写入量为 41 PBW。

以下是 SMTX OS + Optane P4800X 在 Oracle 场景下的实验室测试结果。为了评估 Optane 技术与 NAND 的性能差异,我们使用 Intel P4600 进行对比测试。

说明:以下为实验室测试数据,仅供参考。

测试环境

1. 硬件环境

Oracle 测试需要两台测试服务器分别充当 Client 和 Server 角色,它们的硬件配置相同,如下表所示。其中,2 块 Optane P4800X SSD 作为 SMTX OS 分布式存储的 Cache 层,4 块 P4500 作为 Capacity 层。在测试过程中,IO 主要落在 Cache 层上。

hardware.png

作为性能参照的 P4600 环境除了服务器的 Cache Tier 替换为 2 块 Intel(R) SSD DC P4600 Series(1.6 TB)之外,其余配置跟测试目标环境保持一致。

2. 软件环境

deployment.png
Oracle 测试部署图

Oracle 测试的部署图如上图所示,两台测试服务器都运行 vSphere ESXi 6.5 u2 Hypervisor,其上运行着 SCVM(Storage Controller VM, 12 vCPU 和 16G 内存,运行 SMTX OS)负责提供分布式存储功能。它们还分别运行 Oracle Client VM 和 Oracle Server VM。

Oracle Client VM 的配置为:

  • vCPU:50
  • Mem:50G
  • OS:CentOS 7.5

Oracle Server VM 的配置为:

  • vCPU/Mem:16/64G,32/128G,64/196G 共三种配置
  • SWAP 分区:33G
  • OS:RedHat 6.9
  • Oracle Server:Oracle Server 11.2.0.4
  • Disks:所有磁盘都在 SMTX OS 的 NFS 存储中产生,磁盘数量和大小如下表所示,为了防止对于 SCSI controller 的竞争,为不同的 Disk Group 分配不同的 SCSI controller。
software.png

测试方法

1. 测试工具

HammerDB 3.1,运行在 Oracle Client VM 中。

2. 测试参数

test-parameters.png

3. 测试步骤

测试 Oracle Server 在 vCPU/Mem 分别为 16/64G、32/128G、64/192G 三种配置下的 TPM。最终选取 TPM 趋于平稳阶段的取值作为测试结果。

测试结果

test-result.png

上图显示了 Optane P4800X 和 P4600 在 Oracle Server 不同配置下 HammerDB TPM 的测试结果,可见:

  1. 在 16 vCPU/64G Mem 配置下,P4800X 的 TPM 达到 P4600 的 3 倍。
  2. 在 32 vCPU/128G Mem 和 48 vCPU/192G Mem 两种配置下,P4800X 的 TPM 比 P4600 高 30% 左右。
  3. 同时,从以下 TPM 曲线中,可以看出 P4800X 的 TPM 比 P4600 稳定性高许多,当 vCPU/Mem 资源较多时,不会出现明显的性能下降。
TPM.png

适用场景推荐

从上边的测试结果来看,SMTX OS + Optane P4800X 在数据库场景有非常好的性能表现。更确切地说,SMTX OS + Optane P4800X 的组合在一些 IO Queue Depth 比较低、低延迟敏感、追求业务 QoS 的应用场景中,将发挥出比 NAND SSD 更强悍的性能优势。同时,Optane P4800X 更长的使用寿命对于具有大量写操作的应用场景而言也不失为一个更好的选择。

参考文献:
[1] https://www.intel.com/content/dam/www/public/us/en/documents/product-briefs/optane-ssd-dc-p4800x-brief.pdf

了解更多产品信息,请点击:https://www.smartx.com/smtx-os/

请扫描下方二维码,关注 SmartX 微信公众号“ SmartX 超融合”,第一时间了解更多超融合选型、评估、迁移等专业知识,以及最新产品动态、行业实施方案与案例。 weixin1.png

继续阅读