硬盤太慢英特爾傲騰來補

英特爾

2017-04-14 20:08 9041

2017年3月，英特爾發(fā)布的面向臺式機的英特爾(R) 傲騰(TM)內(nèi)存模塊（16GB和32GB），將從4月24日起上市。

北京2017年4月14日電 /美通社/ -- 2017年3月，英特爾發(fā)布的面向臺式機的英特爾® 傲騰? 內(nèi)存模塊（16GB和32GB），將從4月24日起上市。在半導體技術驅(qū)動下，計算機性能沿著摩爾定路突飛猛進，然而，仍舊逃離不開“存儲”的瓶頸制約，拖累整個系統(tǒng)性能提升緩慢。使用閃存（NAND）加速的想法一直都在，Wintel都有嘗試，今天，傲騰（Optane）將有機會改變這一切。

雖然已經(jīng)有了數(shù)十年的歷史，但是馮·諾依曼1946年提出的計算機體系架構，仍是現(xiàn)在乃至可見的未來，計算機所遵循的基本架構體系：存儲和計算。CPU是大家所熟悉的計算核心，但是并非馮·諾依曼體系中的計算核心，按照大學計算機原理課老師所說，CPU非常笨，它只會做“1+1”這一件事，而且只會從A、B寄存器取數(shù)、結果放到C寄存器，馮·諾依曼體系中的計算是指ALU（數(shù)邏運算單元）而存儲是寄存器。當然，這是最狹義的馮·諾依曼體系理解，不過也從側(cè)面說出了計算和存儲相依相存的特殊關系。

計算和存儲的關系相依相存

速度快當然是王道，但是非常遺憾，半導體技術發(fā)展到今天，仍然不能解決容量和性能的根本矛盾，考慮到成本和實現(xiàn)因素，最終的產(chǎn)品都是性能向成本的妥協(xié)。歷史上看，誰能將兩者的平衡點向性能或容量任一端推動，定將帶來世界的巨大改變。SRAM到DRAM、閃存盤對軟盤/光盤、SSD對HDD，以及剛剛面世的Optane。

快慢設備的銜接

“多點潤滑、少點摩擦”，這是海灣戰(zhàn)爭期間的著名潤滑油廣告。而對于計算機來說，高速和低俗設備之間，對獲取數(shù)據(jù)方面的摩擦一直沒有停止過，解決這種數(shù)據(jù)沖突的方式也在革新。

以速度較快的ALU為例，與之進行數(shù)據(jù)交換的寄存器有著相同速度的寄存器，除去在相鄰周期里循環(huán)存取的時間周期不算，兩者實際上是同頻同步工作的。寄存器有著動輒數(shù)GHz的運行速度，只能集成在離ALU最近的地方，但代價是成本高昂、容量以字節(jié)為單位精打細算，這就是為什么如AVX 2.0中的256位指令/數(shù)據(jù)寄存器，英特爾更壕一些，直接放入256位長，而AMD摳門些，旗艦的Ryzen 7 1800X只有128位寄存器，256位數(shù)據(jù)需要兩個周期讀入和寫出，性能折損極大。當然，處理器廠商們早已注意到這個問題，n年前就大肆引入Cache結構作為從寄存器到內(nèi)存的梯級緩沖，用數(shù)量和逐漸提高的速度解決計算單元從內(nèi)存獲取數(shù)據(jù)的性能落差。L1、L2、L3 Cache容量通常為數(shù)十KB、數(shù)百KB和數(shù)MB，對應容量提升一個級別，速度也降低一個級別，以匹配慢速的GB級別內(nèi)存。為了保證速度，Cache通常會采用SRAM（靜態(tài)內(nèi)存）制作，而內(nèi)存雖然用了DRAM速度低了不少，但當年正是DRAM的出現(xiàn)，讓配有64KB內(nèi)存的PC有機會誕生，要知道同容量的SRAM當時價格超過2500美元，而第一臺PC的不過1999美元。

類似的情況也出現(xiàn)在“存儲”設備上，雖然以硬盤（HDD）為代表的存儲設備已經(jīng)是外設“矬子里面的將軍”，但是它和PC系統(tǒng)之間的性能落差仍然很大，其性能包括了帶寬和響應延遲等兩個維度的速度。于是另一種緩存，Buffer出現(xiàn)了。別看中文都是“緩存”，但是在計算機詞匯中，Cache和Buffer是兩個不同世界的速度，相比多采用SRAM的Cache，Buffer多使用廉價的DRAM以緩解I/O接口兩側(cè)的速度不匹配，最常見的情形是Buffer容量作為HDD的重要參數(shù)標識產(chǎn)品檔次。無論是哪種緩沖，都能在響應時間和帶寬上同時匹配兩端性能，兩端都認為對方遷就了自己的性能水準，而沒有察覺到緩沖的加入，此現(xiàn)象就叫透明。

容量與性能的分歧

經(jīng)過多級緩沖，DRAM的速度已經(jīng)遠遠落后于CPU，但即便如此，它仍遠遠高于主流的存儲設備。更具體點說，單通道DDR4-2400內(nèi)存帶寬已近20GB/s、延遲為30ns左右，而容量已突破10TB的HDD，對應的性能水準只略微增長到150MB/s~200MB/s帶寬，延遲則停留在3~4ms（接口）+7~8ms（平均尋道）的10年前水平，明顯不能滿足當下電腦系統(tǒng)的需求。于是這才有了近幾年較有效的升級已經(jīng)從增加內(nèi)存變?yōu)榱烁鼡QHDD為SSD。SSD綜合性能較HDD已經(jīng)有了質(zhì)的飛躍，主流產(chǎn)品接口帶寬突破1GB/s水平、延遲下降到μs量級，但與之伴隨的就是10倍的價格差異。

無論是容量還是性能，對使用體驗的影響都是顯而易見的。在預算有限的前提下，考慮到時間可以換取性能而容量不行，更多數(shù)消費者都傾向于容量更大而非性能更高，這也就是為何仍有超過85%的臺式電腦選擇HDD作為唯一存儲設備的原因。但凡預算寬裕一些，或者性能的需求稍占上風，雙硬盤就成為更為理想的搭配。現(xiàn)實是很殘酷的，艱難的預算增加，并不能帶來如一的性能體驗，頻繁使用的數(shù)據(jù)固然可以手動放置到SSD中，但是相對較小的容量被占滿后，越是大量的數(shù)據(jù)，越會深刻體會到“慢”的熬人，小容量SSD對此無能為力。

能夠彌合電腦與HDD性能落差、解決SSD與HDD容量落差的Optane來了。

橫空出世

SSD的出現(xiàn)，可謂是近年來存儲領域較大的技術革新。以高速旋轉(zhuǎn)的磁碟片為基礎的HDD，數(shù)十年來維持在溫徹斯特架構下幾乎沒有變化，無論是體積縮小還是容量增加，都不能很好地解決速度問題，哪怕是即將到來的熱輔助磁存儲技術，也只是幫助容量大幅提升而對性能的提升仍是隔靴搔癢，機械原理限制了HDD性能質(zhì)的升級。SSD核心的改變正在于以半導體取代機械，ms進入μs、MB/s提升到GB/s。按下葫蘆起來瓢，SSD讓成本和耐久性問題浮出水面，NAND的存儲介質(zhì)可謂“萬惡之源”。

NAND是閃存（Flash）中最主要的類別，具有讀寫耐久性隨制程提升下降、性能隨制程提升下降等固有特性，特別是為了在有限的晶圓（成本）上獲得更大容量，制程和單元結構升級一直沒有停止過，如今NAND已經(jīng)進入10nm時代、TLC漸成主流，反觀其耐久性艱難維持在2000次左右，延遲和介質(zhì)性能改進緩慢。

2015年，英特爾正式發(fā)布了名為3D XPoint的全新非易失性存儲技術，這就是橫空出世的Optane傲騰；與英特爾合作生產(chǎn)相關產(chǎn)品的美光，則將其命名為QuantX。3D XPoint或者說Optane與NAND/NOR等Flash完全不同，而更接近于內(nèi)存，延遲、耐擦寫性、介質(zhì)速度等幾個關鍵指標也優(yōu)于NAND幾個數(shù)量級，未來發(fā)展?jié)摿薮?，英特爾的目標是用其擴大僅有5%左右的SSD市場份額。

Optane的非易失性和性能優(yōu)勢，使其可在計算機系統(tǒng)中扮演多種甚至是任何存儲角色：內(nèi)存、存儲和緩存，分別對應Optane DIMM、Optane SSD和Optane Memory，從而改變整個計算機存儲發(fā)展進程。目前后兩類產(chǎn)品已經(jīng)上市。

為了獲得極速的存儲，一種名為RAMDisk的產(chǎn)品已經(jīng)問世多年。它采用單位容量昂貴的DRAM為存儲介質(zhì)，使系統(tǒng)用訪問硬盤的方式訪問它，性能當然是內(nèi)存水平的，而容量也是內(nèi)存水平的數(shù)GB。顯然，這樣的容量水平對PC都不夠用，何況這樣的“硬盤”還要面臨掉電數(shù)據(jù)丟失（易失性）的問題，使用時先要從硬盤讀取數(shù)據(jù)、關機前人工將數(shù)據(jù)寫回硬盤，可用性不佳。今天，Optane SSD已經(jīng)具有了RAMDisk的性能卻有著數(shù)TB的超大容量和非易失性，后者已經(jīng)沒有繼續(xù)存在的意義。

Optane Memory則是比NAND更為理想的緩存材料，更高的耐久性和ns級的響應速度，比當年英特爾涉足緩存領域的TurboMemory所使用的SLC NAND表現(xiàn)優(yōu)1~3個數(shù)量級，更別提如今漫天的TLC產(chǎn)品了。性能改善之余，32GB的超大容量早已突破系統(tǒng)緩沖的需求，甚至作為超高性能的SSD也不為過（想想Optane SSD的表現(xiàn)），它更大的作用是為Windows以外的更多應用和數(shù)據(jù)進行緩沖和優(yōu)化，實用性遠超當年512MB的TurboMemory產(chǎn)品。只要用上英特爾200系列的芯片組和7代酷睿處理器，Optane Memory的延遲水平直逼DRAM。想象一下有否體驗過內(nèi)存的延遲水平或速度不足，沒有吧？未來“硬盤”也不會再有今天煩人的等待，與內(nèi)存同速。

消息來源：英特爾