大数据时代对存储和处理提出了越来越高的要求。相应地,需要更快的数据传输速度。
根据数据表的声明选择系统时,陷阱等待着
大数据时代对存储和处理提出了越来越高的要求。相应地,需要更快的数据传输速度。
当客户选择固态硬盘 (SSD) 时,他们通常会参考数据表的性能数据。但是,数据表中的数字并不能准确代表典型的 SSD 性能。通常认为,从处理器和存储设备获得的实际性能与数据表和基准测试中声称的性能有很大不同。因此,根据夸大的数字选择设备可能会导致系统不符合其要求。
使用CrystalDiskMark来衡量实际性能
数据表中的开箱即用声明与现实世界的稳态基准测试之间的差异有多大?
为了测量开箱即用和稳态性能之间的差异,我们使用 CrystalDiskMark 基准测试工具,然后运行一系列随机写入 72 小时,然后再次测量 CrystalDiskMark 性能。
我们仔细测量了闪存控制器的实际性能,并与竞争对手的性能进行了对比。
实际性能与数据表声明
实际性能和数据表性能之间的差异令人震惊。
在我们基准测试的某些设备中,稳态速度可能只有开箱即用性能的 1%。更令人惊讶的是性能下降的速度有多快。在几乎所有测试的驱动器中,使用约1.5分钟后性能急剧下降。
我们的发现表明,在闪存的情况下,除了不切实际的峰值数字和应用程序性能之间的通常差异之外,即使是原始性能数字在实践中也可能经不起审查。
数据表声明和实际基准之间有什么区别?
为了提高闪存的存储密度,制造商现在每个存储单元存储多个位。三级单元 (TLC) 存储器存储三位,而较新的四级单元 (QLC) 存储器每个单元存储四位。
但是,高密度存储是有代价的。
当闪存充满数据时,闪存控制器必须执行各种后台任务。例如,垃圾回收、磨损均衡、动态数据刷新和校准在后台进行。控制器可以通过确定 I/O 操作的优先级和调度,在短时间内“隐藏”这些影响。但是,对于较长的传输,这些任务不可避免地会对性能产生一些影响。从长远来看,磨损均衡和垃圾收集等后台任务变得更加耗时。
数据涌入闪存也会对顺序和随机访问造成影响。用于表征 SSD 的两个主要测量方法是顺序访问,其中大量连续数据传输到存储设备或从存储设备传输大量连续数据,以及随机访问,其中少量数据被读取或写入非连续地址。顺序访问通常以兆字节/秒 (MB/s) 为单位,而随机访问通常以每秒输入/输出操作数 (IOPS) 为单位。
随着缓存被数据填满,闪存上的可用空间会减少。因此,缓存在长时间的顺序或随机访问后开始失去其有效性。随着时间的推移,缓存可能会变得越来越低效,因为某些区域可能会由于不可恢复的错误而被标记为不可用。
因此,随着闪存老化,高密度闪存中的原始错误率会变高,内存寿命也会缩短。软错误解码威廉希尔官方网站 用于最大限度地减少随着内存老化而增加的错误率。它们多次读取数据,需要复杂的处理才能计算出正确的数据,这两者都会降低整体性能。
随着时间的推移,器件也会对在与写入数据的温度不同的温度下读取数据而引起的交叉温度效应变得更加敏感。SSD在使用过程中会变得更热,因此为了防止过热,采用了“热节流”。热节流可降低功耗并降低设备温度。但是,热限制也会限制设备性能。热限制的影响取决于环境温度、环境的热设计和设备工作负载。影响热限制的变量数量使得很难预测实际的性能水平。
总之,由于许多因素,SSD 的性能级别在其生命周期内会发生变化,将其初始的开箱即用级别降至稳定状态级别。
主要要点
在评估性能会影响整体系统性能的设备时,使用真实数据至关重要。任何基于夸大数字的选择都有可能导致系统无法按预期执行。
实现的实际性能将取决于数据使用模式、环境和闪存控制器的有效性。了解可能影响性能的因素至关重要,但更重要的是使用真实数据而不是不切实际的性能声明。
因此,在选择数据存储设备时,请记住,设备数据表通常会显示峰值数字,这些峰值数字只能通过新设备在特定条件下实现,并且只能在短时间内实现。
审核编辑:郭婷
-
SSD
+关注
关注
21文章
2865浏览量
117514 -
固态硬盘
+关注
关注
12文章
1466浏览量
57422
发布评论请先 登录
相关推荐
评论