3D NAND BiCS3新血注入 PCI-e SSD进攻企业储存市场
数据储存装置应用更迭,其中占大宗应用的储存硬盘从传统硬盘(HDD)崛起到固态硬盘(SSD)问世相距不过半世纪,SSD就来势汹涌地蚕食各种储存应用市场。 SSD之所以能日新又新表现卓越性能,除了NAND Flash读写效能持续增进外,SSD接口也因应带宽限制而不断升级,依序推出PATA、SATA而至PCI-e等更高效能之接口,于是SSD一跃而成大众消费市场的宠儿。
当各家SSD控制器供货商在产品设计屡屡推陈出新、技术愈臻成熟稳定时,SSD也开始跨足企业储存市场。 迄今最新支持PCI-e接口的SSD应用控制器足以支持PCI-e Gen3×4,传输带宽近32Gbps,远远超越过去SATA3.0的6Gbps带宽,预期PCI-e SSD需求会愈来愈高,甚至有机会取代SATA SSD, 也是时候顺势进入企业储存市场,因应市场应用随之推出适合的PCI-e SSD。
企业储存常见的三个应用范畴分别是内容传递(Content Delivery)、虚拟环境(Virtual Environments)和数据库管理(Database Management),根据其市场而个别引进强调读取、 专注写入或读写兼具的SSD(表1)。 借着内容传递作为商业模式的市场如网络服务、云端运算和Metadata加速搜寻市场等,采用的SSD储存装置着重读取速度和延迟(Latency)效能;虚拟环境下的虚拟平台同时要求随机读写IOPS(Input/Output Operations Per Second)和低延迟,适合选用读写兼具的SSD;至于数据库管理如数据中心强调数据记录与备份,写入取胜的SSD更容易脱颖而出。
整体来说,企业储存市场对SSD储存装置之要求相对于消费型市场更为严谨,除了速度考虑之外,其他像是储存服务质量(Quality of Service, QoS)、企业等级数据保护技术和内部传输端数据保护(End-to-End Data Protection)等规格,都是SSD控制器供货商需要达到其标准才有机会角逐企业储存市场的一席之地,这几项规格也将在本文后续逐一探讨其重要性。
储存服务质量稳定
SSD储存服务质量意指SSD在特定时间内进行读写时,能够维持稳定且一致的延迟时间(Latency)。 换言之,储存服务质量表示SSD处理数据指令时,从99%甚至到99.999%之信赖区间,不同信赖水平线能保证数据处理之回复时间(Response Time),做为企业SSD储存装置评比之一。
然而,SSD采用的NAND Flash受其特性限制,往往在处理主机端(Host)数据时,也需要同步着手SSD内部背景管理(Background Management),诸如数据抹除(Erase)、碎片回收(Garbage Collection)、耗损平均技术(Wear Leveling)等,进而递延整个SSD处理时间,甚至有可能产生高延迟异常值(Latency Outlier)、速度骤降等问题(图1)。
因此,为了维持储存服务质量之稳定与一致性,避免发生速度骤降或强烈震荡不稳等问题,SSD控制芯片需要优化分配内部资源与处理程序,以求有效降低处理后之回复时间。 常见的解决方式有三种,各是指令优先处理设计(High Priority Queue)、搁置数据抹除程序(Erase Suspend)和平衡储存服务质量载量(QoS Load Balancing)。
指令优先处理设计的概念在于SSD执行内部背景管理时,即使数据抹除、碎片回收或耗损平均技术等功能正在进行中,SSD都会优先处理主机下达之读取指令,以免耽搁数据读取时间。
搁置数据抹除程序设计原意是考虑3D NAND之数据抹除时间远远大于过往的2D NAND,是故SSD处理读写指令时,3D NAND数据抹除时间过久易导致高延迟异常值产生以及整体速度不一。 幸而SSD控制芯片也跟着与时俱进推出搁置数据抹除程序,假使数据抹除程序正在执行,SSD又须读写数据,SSD控制芯片便先把数据抹除程序分段并暂时搁置下来,改而优先处理数据读写指令,缩短指令延迟时间(Command Latency),最后再把已搁置的数据抹除程序处理完毕。
平衡储存服务质量载量会有效分配处理写入SSD的数据,适当地释放写入缓冲器(Write Buffer)的空间,确定写入缓冲器拥有足够大的空间得以跟整个SSD带宽相搭配,并表现SSD稳定的延迟时间,谋求最佳储存服务质量。
SSD数据读写速度通常会依据数据量、数据结构和SSD内部可用空间而影响整体速度表现。 以图2而言,新碟SSD的FOB(Fresh-Out-of-BOX)性能表现会最佳,随着使用时间一久,数据持续填塞SSD,速度会逐渐趋缓,最后数据几近占满整个SSD储存空间后,SSD会呈现持续性访问速度(Sustain Performance),其关乎到储存服务质量是否良好。 愈趋稳定、速度摆荡幅度愈小的持续性访问速度,意谓着储存服务质量愈佳,所以企业储存市场不只是在乎持续存取效能与稳定性,也关切储存服务质量保证之数据处理回复时间。
图2 SSD持续存取效能对储存服务质量的重要性
数据源:群联电子整理
内部传输端数据保护有一套
传输端数据保护机制(End-to-End Data Protection)会安排在数据传输过程的各个传输端点都能执行数据侦错,避免主机端存取到SSD错误的数据(如图3)。 当数据写入SSD时,写入路径相继从主机端进入PCIe IP、数据缓冲器(Data Buffer)、Flash IP而至NAND Flash,数据读取路径则是反向从NAND Flash回到主机端, 让数据读写都能在各端点重重关卡下确认数据正确性,甚至SSD控制芯片内部之随机存取内存(RAM)能侦测错误(Soft Error)外,亦有机会更正且避免错误的数据传送给主机端。
LLAP保数据遗失风险
保护机制的全面性与完整性常是企业储存市场注重的焦点之一。 一般而言,SSD内部的数据传输过程中,数据会经过控制芯片、高速缓存(Cache)而至NAND Flash。 倘若在数据传输过程间,不小心发生非预期供电不稳或不正常断电,正在传输的数据却尚未完整储存在NAND Flash的话,数据遗失导致的后果难以想象。
为了消弭数据遗失风险,SSD控制芯片供货商过往在韧体架构上,针对数据保护机制曾经提出两种简易作法。 因供电不稳容易导致主机端和SSD储存装置链接的通讯桥梁(SATA/PCIe Link)先中断,SSD控制芯片侦测到通讯桥梁(SATA/PCIe Link)中断时,采取的简易作法有二,数据传输之主动暂停模式(Link-Loss Auto Pause, LLAP)和数据传输之主动冲刷模式(Link-Loss Auto Flush, LLAF),预期能及早将数据遗失的风险降至最低。
数据传输之主动暂停模式(Link-Loss Auto Pause, LLAP)意指SSD控制芯片侦测到主机端和SSD之间的接口通信链接中断,同时数据仍在进行传输,SSD控制芯片首要作业会改成把正在NAND Flash内写入的Page完整写完,接着暂停后续之传输行为;至于数据传输之主动冲刷模式(Link-Loss Auto Flush, LLAF)则是SSD控制芯片侦测到主机端和SSD之间的接口通信链接中断,同时数据仍在进行传输, SSD控制芯片会趁着有限电力尽可能地将快取(Cache)内数据冲刷进NAND Flash储存。
百密终有一疏,这两种作法不能百分之百保证数据储存完整性,快取内数据可能在有限电力下难以全部储存到NAND Flash,最万无一失的防范方式,韧体仍然须要搭配电容而得的硬件设计,数据储存才能零风险。
现今硬件设计上较广为人知的作法是透过硬件电容储存电力,即使遇到电力突然中断,SSD韧体就可以借着电容内电力将数据储存到NAND Flash。 最初设计SSD电路板时,就需要因应非预期断电之风险而选用合适的电容、pFail芯片和电感(图4)。 整体设计与实测之后,在一般正常电力供电时,SSD内部会先启动pFail芯片,通过电感而至电容充电完毕,再通知SSD控制芯片充电状态是否完成,然后电力供应整个SSD内部系统,经电源管理芯片(PMIC) 分歧出各式电压供电给动态随机存取内存(DRAM)、NAND Flash和SSD控制芯片,SSD再开始运作读写程序。
当SSD读写过程中,突然遭遇到不正常断电时,最先侦测到供电端断电的是pFail芯片,遂而通知SSD控制芯片停止接收主机端数据,再把快取数据写入NAND Flash储存,同时电容也会提供自有电力供应给SSD把数据储存完毕, 如此一来就能确保SSD内部数据完整性,数据也能获得全面保护,免去数据遗失之风险。
正当SSD储存装置从消费性市场逐渐跨足企业储存市场之时,SSD硬件和韧体搭配应用成为数据保护机制的重点,能否有此相关技术与资源的SSD控制芯片供货商亦屈指可数。
近期便有厂商推出支持PCI-e Gen3×4的八信道(Channel)控制芯片,内建双核心CPU,资源分配更得心应手,并且具备更胜一筹的LDPC错误纠错能力,强化3D NAND可靠度。 搭载3D NAND BiCS3的SSD容量可达到8TB,该控制芯片所采用PCIe接口设计,传输带宽远大于SATA3.0,系统延迟也大幅减少,并提升随机访问速度,BiCS3 SSD连续读写速度可达到3.2GB/3.0GB/s( 图5),随机读写速度(Input/Output Operations Per Second)达到600K/600K IOPS。
尤其在数据保护机制上,PS5012除了韧体架构有信心满足企业储存市场之需求外,亦加上硬件设计作双重数据保护,进一步强化产品的同时也加深客户满意度。






关闭返回