武林霸业公益单职业的简单介绍

单职业传奇私服 2022-09-12 123

作者 白丁

给SSD Fans原创投稿技术或市场文章,拿>=100元稿费。

为了测试VROC,我们使用了下面的两个平台:

为了更好地表示真实世界的QD = 1的性能,在两个平台上都禁用了c状态。 在某些平台上,QD = 1的基准测试不会充分加载CPU,以便观察整个系统的响应能力,因为较低的时钟速率会对存储性能产生负面影响。 发生这种情况是因为存储基准测试只关注存储,而没有其他的东西。 真实世界的应用程序将执行计算或以其他方式对访问的数据执行操作,导致系统以更高的时钟速率运行。 禁用c状态让我们在运行这些更简单的测试时更接近现实世界的状态。

为了速度的起见,在图表中只选取了随机和顺序读取。 请注意,在测试之前,每个阵列都完全按顺序写入(刚出厂的SSD从未被写入过,可能会”作弊”并立即返回零,甚至没有接触到闪存,所以唯一的真实结果可以通过读取以前写过的区域来获得)。

使用一套匹配的四个Optane Memory 32GB模块来评估IOPS和延迟,同时使用一组四个Samsung960 PRO 512GB SSD来评估最大吞吐量。

4KB随机读

IOPS:

展开全文

直接进入这些结果,我们有两组IOPS曲线。 底部集合显示了添加到RAID-0的960 PRO SSD越来越多时的IOPS响应。 最上面的集合使用不同数量的Optane内存模块代替960 PRO时的IOPS。 请注意,Optane的IOPS性能远远优于我们迄今测试过的最快的NAND SSD。 四台960 PRO只能打败一个32GB的Optane内存模块,但是只能在QD = 32的时候这样做,只是因为在QD = 8时Optane部分饱和了,所以三星有时间赶上。Optane在较低的队列深度上有一个特殊的地方,那就是在RAID阵列上,任何RAID配置都会损失近一半的性能优势。 如果我们以不同的方式分解结果,则更加清楚,更加关注较低的队列深度:

请注意最近左边的深蓝色(QD = 1)的条形柱,开始时大约为100,000 IOPS,但接下来的三个蓝色条中都下降到50,000 IOPS。三个颜色分别是QD=1,2,4.

延迟:

先关注左下角。 10微秒符合Optane Memory的预期延迟。 不幸的是,似乎任何形式的VROC RAID都会增加6微秒的延迟时间。 我们已经在Z170平台的三重M.2 RAID测试中看到了这个数字,但是我希望对这个新平台没有什么负面影响,特别是VMD控制器处于CPU /硬件级别。 不过,请记住,我们正在处于预发布,以及这里的所有内容,所以显然需要进行优化和改进。

对上面的图表做一个总体的说明。 请注意,添加固态硬盘时,延迟曲线会顺时针旋转,有效地扁平化,并在向上弯曲之前使其达到较高的QD(由于增加了控制器/媒体负载,延迟会开始猛增)。

QD = 1-4的柱状图表使得Optane和960 PRO之间的延迟差异变得很明显。

128KB顺序

请注意,我们选择128KB顺序测试,是因为内核会将大于128KB的请求拆分为多个并发的128KB的块(并且QD的值比预期更高)。

现在我们到了有趣的部分。 地下的几条曲线(从〜1GB / s点开始并跨越增加)都是Optane。 这些仅在PCIe 3.0 x2上链接,但并不意味着在顺序性能上表现突出。 尽管如此,按照QD = 8测试,我们看到它们的吞吐量增长到接近6GB/s。 960 PRO的x4链接和一个控制器通道布局能更好地优化Optane的顺序吞吐量。 其余配置的960 PRO在顺序性能上能轻易击败Optane。

QD = 16,与我们在Windows批量文件复制操作的trace中看到的一样高,所以我已经结束了在该深度的柱状图的展开。 无论如何,QD = 32时并没什么意义,因为所有配置在QD = 8时,已经接近饱和度。

在这里,我们只关注Optane下QD = 32的配置以及从单个SSD到四个SSD的RAID-0的960 PRO。 理想情况下,我们期望在这里进行线性缩放,而这看起来正像是发生了什么事情。 Quad Optane Memory 32GB达到了5.6GB/s,而960 PRO 512GB达到了13.2 GB / s!

性能对比: X299 VROC vs. Z270 RST

好吧,现在我们已经看了X299 VROC,看看它是如何与Z270的RST实现相结合的。 请注意,我们手头没有通过PCH支持三个M.2 RAID 的Z270主板,,但是我们可以只使用两个快的SSD来使DMI达到饱和,并且可以估算三个RAID的数据。 为了使这些比较容易理解,前三个图表将评估这两个芯片组的单个SSD性能:

单个SSD比较

4KB 随机IOPS

X299和Z270(通过PCH连接以及直接连接到CPU)的Samsung 960 PRO SSD性能几乎完全相同,不过Z270平台确实有一点小小的优势。 Optane(32GB)部件的高端部分都达到了相同的最大值,但是看起来像是低QD的性能更好。 、直接连接到7700K CPU的Optane部件在QD=1时的IOPS的起始值超过了93k! 这怎么能比全新的X299平台快得多呢?

4KB延迟

这里最重要的是在QD = 1栏的前三位数字。 首先,我们看到来自X299测试的10.7us的图形。 在把SSD安装到M.2插槽中(M.2位置将很可能连接到PCH,因此RST RAID是可能的)的Z270上,这个数字跳转到了12.2us, 将SSD安装到标准PCIe插槽(通过插入器)可将延迟降至10.1us。 这告诉我们两件事情:

(1)与7960X相比,7700K的更快的时钟和更低的核心的DRAM延迟削减了0.6us的事务延迟。

(2)对于通过PCH进行通信的SSD,Z270平台每条事务延迟惩罚约为2.1us。

128KB顺序测试

Z270有一点扩展,在Optane(橙色)上QD序列较高时表现出奇数衰减,而PCH和直接连接的Z270(绿色+隐藏在它后面的浅蓝色)的表现明显优于在X299平台上(黄色)的表现。 通常情况下,三星的测试结果是相同的,但是在完成这些测试之后,我们发现三星NVMe驱动程序在无意中安装到了我们的Z270测试系统上,从而提高了单个SSD的连续测试结果。 我将使用标准的NVMe驱动程序重新运行这些测试,并在可能的情况下进行更新。 现在我们转向在两个平台上比较RAID性能。 为了使图表合理可读,我将坚持QD = 1为随机测试,QD = 32为顺序测试。

多SSD RAID-0比较

4KB随机IOPS

对于960 PRO,与X299(橙色)相比,Z270(黄色)增加了几个IOPS。

对于Optane Memory,X299(蓝色)在单SSD配置中击败Z270(灰色),但是X299在RAID中的更高的延迟损失使其落后。 请注意,如果单个SSD直接连接到CPU(93k IOPS),则Z270可以在整个板上击败X299。

4KB随机延迟

这并不奇怪,因为这实际上是上面看到的IOPS的倒置。 直接连接到CPU的Z270单个SSD SSD Optane Memory将为10.1微秒,迫使灰色线上的所有点上低于蓝色。

128KB顺序测试

这是我们完成的上一页的图表,但Z270的数据已被添加。 x3的估计吞吐量就是960 PRO的x2饱和吞吐量。 消除DMI瓶颈当然有很大帮助,因为X299数字只是略高于Z270,特别是使用960 PRO SSD时!

下篇预告:VROC总结与分析

企业级

评论