北京2017年4月14日電 /美通社/ -- 2017年3月,英特爾發(fā)布的面向臺(tái)式機(jī)的英特爾® 傲騰? 內(nèi)存模塊(16GB和32GB),將從4月24日起上市。在半導(dǎo)體技術(shù)驅(qū)動(dòng)下,計(jì)算機(jī)性能沿著摩爾定路突飛猛進(jìn),然而,仍舊逃離不開(kāi)“存儲(chǔ)”的瓶頸制約,拖累整個(gè)系統(tǒng)性能提升緩慢。使用閃存(NAND)加速的想法一直都在,Wintel都有嘗試,今天,傲騰(Optane)將有機(jī)會(huì)改變這一切。
雖然已經(jīng)有了數(shù)十年的歷史,但是馮·諾依曼1946年提出的計(jì)算機(jī)體系架構(gòu),仍是現(xiàn)在乃至可見(jiàn)的未來(lái),計(jì)算機(jī)所遵循的基本架構(gòu)體系:存儲(chǔ)和計(jì)算。CPU是大家所熟悉的計(jì)算核心,但是并非馮·諾依曼體系中的計(jì)算核心,按照大學(xué)計(jì)算機(jī)原理課老師所說(shuō),CPU非常笨,它只會(huì)做“1+1”這一件事,而且只會(huì)從A、B寄存器取數(shù)、結(jié)果放到C寄存器,馮·諾依曼體系中的計(jì)算是指ALU(數(shù)邏運(yùn)算單元)而存儲(chǔ)是寄存器。當(dāng)然,這是最狹義的馮·諾依曼體系理解,不過(guò)也從側(cè)面說(shuō)出了計(jì)算和存儲(chǔ)相依相存的特殊關(guān)系。
速度快當(dāng)然是王道,但是非常遺憾,半導(dǎo)體技術(shù)發(fā)展到今天,仍然不能解決容量和性能的根本矛盾,考慮到成本和實(shí)現(xiàn)因素,最終的產(chǎn)品都是性能向成本的妥協(xié)。歷史上看,誰(shuí)能將兩者的平衡點(diǎn)向性能或容量任一端推動(dòng),定將帶來(lái)世界的巨大改變。SRAM到DRAM、閃存盤(pán)對(duì)軟盤(pán)/光盤(pán)、SSD對(duì)HDD,以及剛剛面世的Optane。
快慢設(shè)備的銜接
“多點(diǎn)潤(rùn)滑、少點(diǎn)摩擦”,這是海灣戰(zhàn)爭(zhēng)期間的著名潤(rùn)滑油廣告。而對(duì)于計(jì)算機(jī)來(lái)說(shuō),高速和低俗設(shè)備之間,對(duì)獲取數(shù)據(jù)方面的摩擦一直沒(méi)有停止過(guò),解決這種數(shù)據(jù)沖突的方式也在革新。
以速度較快的ALU為例,與之進(jìn)行數(shù)據(jù)交換的寄存器有著相同速度的寄存器,除去在相鄰周期里循環(huán)存取的時(shí)間周期不算,兩者實(shí)際上是同頻同步工作的。寄存器有著動(dòng)輒數(shù)GHz的運(yùn)行速度,只能集成在離ALU最近的地方,但代價(jià)是成本高昂、容量以字節(jié)為單位精打細(xì)算,這就是為什么如AVX 2.0中的256位指令/數(shù)據(jù)寄存器,英特爾更壕一些,直接放入256位長(zhǎng),而AMD摳門(mén)些,旗艦的Ryzen 7 1800X只有128位寄存器,256位數(shù)據(jù)需要兩個(gè)周期讀入和寫(xiě)出,性能折損極大。當(dāng)然,處理器廠商們?cè)缫炎⒁獾竭@個(gè)問(wèn)題,n年前就大肆引入Cache結(jié)構(gòu)作為從寄存器到內(nèi)存的梯級(jí)緩沖,用數(shù)量和逐漸提高的速度解決計(jì)算單元從內(nèi)存獲取數(shù)據(jù)的性能落差。L1、L2、L3 Cache容量通常為數(shù)十KB、數(shù)百KB和數(shù)MB,對(duì)應(yīng)容量提升一個(gè)級(jí)別,速度也降低一個(gè)級(jí)別,以匹配慢速的GB級(jí)別內(nèi)存。為了保證速度,Cache通常會(huì)采用SRAM(靜態(tài)內(nèi)存)制作,而內(nèi)存雖然用了DRAM速度低了不少,但當(dāng)年正是DRAM的出現(xiàn),讓配有64KB內(nèi)存的PC有機(jī)會(huì)誕生,要知道同容量的SRAM當(dāng)時(shí)價(jià)格超過(guò)2500美元,而第一臺(tái)PC的不過(guò)1999美元。
類似的情況也出現(xiàn)在“存儲(chǔ)”設(shè)備上,雖然以硬盤(pán)(HDD)為代表的存儲(chǔ)設(shè)備已經(jīng)是外設(shè)“矬子里面的將軍”,但是它和PC系統(tǒng)之間的性能落差仍然很大,其性能包括了帶寬和響應(yīng)延遲等兩個(gè)維度的速度。于是另一種緩存,Buffer出現(xiàn)了。別看中文都是“緩存”,但是在計(jì)算機(jī)詞匯中,Cache和Buffer是兩個(gè)不同世界的速度,相比多采用SRAM的Cache,Buffer多使用廉價(jià)的DRAM以緩解I/O接口兩側(cè)的速度不匹配,最常見(jiàn)的情形是Buffer容量作為HDD的重要參數(shù)標(biāo)識(shí)產(chǎn)品檔次。無(wú)論是哪種緩沖,都能在響應(yīng)時(shí)間和帶寬上同時(shí)匹配兩端性能,兩端都認(rèn)為對(duì)方遷就了自己的性能水準(zhǔn),而沒(méi)有察覺(jué)到緩沖的加入,此現(xiàn)象就叫透明。
容量與性能的分歧
經(jīng)過(guò)多級(jí)緩沖,DRAM的速度已經(jīng)遠(yuǎn)遠(yuǎn)落后于CPU,但即便如此,它仍遠(yuǎn)遠(yuǎn)高于主流的存儲(chǔ)設(shè)備。更具體點(diǎn)說(shuō),單通道DDR4-2400內(nèi)存帶寬已近20GB/s、延遲為30ns左右,而容量已突破10TB的HDD,對(duì)應(yīng)的性能水準(zhǔn)只略微增長(zhǎng)到150MB/s~200MB/s帶寬,延遲則停留在3~4ms(接口)+7~8ms(平均尋道)的10年前水平,明顯不能滿足當(dāng)下電腦系統(tǒng)的需求。于是這才有了近幾年較有效的升級(jí)已經(jīng)從增加內(nèi)存變?yōu)榱烁鼡QHDD為SSD。SSD綜合性能較HDD已經(jīng)有了質(zhì)的飛躍,主流產(chǎn)品接口帶寬突破1GB/s水平、延遲下降到μs量級(jí),但與之伴隨的就是10倍的價(jià)格差異。
無(wú)論是容量還是性能,對(duì)使用體驗(yàn)的影響都是顯而易見(jiàn)的。在預(yù)算有限的前提下,考慮到時(shí)間可以換取性能而容量不行,更多數(shù)消費(fèi)者都傾向于容量更大而非性能更高,這也就是為何仍有超過(guò)85%的臺(tái)式電腦選擇HDD作為唯一存儲(chǔ)設(shè)備的原因。但凡預(yù)算寬裕一些,或者性能的需求稍占上風(fēng),雙硬盤(pán)就成為更為理想的搭配?,F(xiàn)實(shí)是很殘酷的,艱難的預(yù)算增加,并不能帶來(lái)如一的性能體驗(yàn),頻繁使用的數(shù)據(jù)固然可以手動(dòng)放置到SSD中,但是相對(duì)較小的容量被占滿后,越是大量的數(shù)據(jù),越會(huì)深刻體會(huì)到“慢”的熬人,小容量SSD對(duì)此無(wú)能為力。
能夠彌合電腦與HDD性能落差、解決SSD與HDD容量落差的Optane來(lái)了。
橫空出世
SSD的出現(xiàn),可謂是近年來(lái)存儲(chǔ)領(lǐng)域較大的技術(shù)革新。以高速旋轉(zhuǎn)的磁碟片為基礎(chǔ)的HDD,數(shù)十年來(lái)維持在溫徹斯特架構(gòu)下幾乎沒(méi)有變化,無(wú)論是體積縮小還是容量增加,都不能很好地解決速度問(wèn)題,哪怕是即將到來(lái)的熱輔助磁存儲(chǔ)技術(shù),也只是幫助容量大幅提升而對(duì)性能的提升仍是隔靴搔癢,機(jī)械原理限制了HDD性能質(zhì)的升級(jí)。SSD核心的改變正在于以半導(dǎo)體取代機(jī)械,ms進(jìn)入μs、MB/s提升到GB/s。按下葫蘆起來(lái)瓢,SSD讓成本和耐久性問(wèn)題浮出水面,NAND的存儲(chǔ)介質(zhì)可謂“萬(wàn)惡之源”。
NAND是閃存(Flash)中最主要的類別,具有讀寫(xiě)耐久性隨制程提升下降、性能隨制程提升下降等固有特性,特別是為了在有限的晶圓(成本)上獲得更大容量,制程和單元結(jié)構(gòu)升級(jí)一直沒(méi)有停止過(guò),如今NAND已經(jīng)進(jìn)入10nm時(shí)代、TLC漸成主流,反觀其耐久性艱難維持在2000次左右,延遲和介質(zhì)性能改進(jìn)緩慢。
2015年,英特爾正式發(fā)布了名為3D XPoint的全新非易失性存儲(chǔ)技術(shù),這就是橫空出世的Optane傲騰;與英特爾合作生產(chǎn)相關(guān)產(chǎn)品的美光,則將其命名為QuantX。3D XPoint或者說(shuō)Optane與NAND/NOR等Flash完全不同,而更接近于內(nèi)存,延遲、耐擦寫(xiě)性、介質(zhì)速度等幾個(gè)關(guān)鍵指標(biāo)也優(yōu)于NAND幾個(gè)數(shù)量級(jí),未來(lái)發(fā)展?jié)摿薮?,英特爾的目?biāo)是用其擴(kuò)大僅有5%左右的SSD市場(chǎng)份額。
Optane的非易失性和性能優(yōu)勢(shì),使其可在計(jì)算機(jī)系統(tǒng)中扮演多種甚至是任何存儲(chǔ)角色:內(nèi)存、存儲(chǔ)和緩存,分別對(duì)應(yīng)Optane DIMM、Optane SSD和Optane Memory,從而改變整個(gè)計(jì)算機(jī)存儲(chǔ)發(fā)展進(jìn)程。目前后兩類產(chǎn)品已經(jīng)上市。
為了獲得極速的存儲(chǔ),一種名為RAMDisk的產(chǎn)品已經(jīng)問(wèn)世多年。它采用單位容量昂貴的DRAM為存儲(chǔ)介質(zhì),使系統(tǒng)用訪問(wèn)硬盤(pán)的方式訪問(wèn)它,性能當(dāng)然是內(nèi)存水平的,而容量也是內(nèi)存水平的數(shù)GB。顯然,這樣的容量水平對(duì)PC都不夠用,何況這樣的“硬盤(pán)”還要面臨掉電數(shù)據(jù)丟失(易失性)的問(wèn)題,使用時(shí)先要從硬盤(pán)讀取數(shù)據(jù)、關(guān)機(jī)前人工將數(shù)據(jù)寫(xiě)回硬盤(pán),可用性不佳。今天,Optane SSD已經(jīng)具有了RAMDisk的性能卻有著數(shù)TB的超大容量和非易失性,后者已經(jīng)沒(méi)有繼續(xù)存在的意義。
Optane Memory則是比NAND更為理想的緩存材料,更高的耐久性和ns級(jí)的響應(yīng)速度,比當(dāng)年英特爾涉足緩存領(lǐng)域的TurboMemory所使用的SLC NAND表現(xiàn)優(yōu)1~3個(gè)數(shù)量級(jí),更別提如今漫天的TLC產(chǎn)品了。性能改善之余,32GB的超大容量早已突破系統(tǒng)緩沖的需求,甚至作為超高性能的SSD也不為過(guò)(想想Optane SSD的表現(xiàn)),它更大的作用是為Windows以外的更多應(yīng)用和數(shù)據(jù)進(jìn)行緩沖和優(yōu)化,實(shí)用性遠(yuǎn)超當(dāng)年512MB的TurboMemory產(chǎn)品。只要用上英特爾200系列的芯片組和7代酷睿處理器,Optane Memory的延遲水平直逼DRAM。想象一下有否體驗(yàn)過(guò)內(nèi)存的延遲水平或速度不足,沒(méi)有吧?未來(lái)“硬盤(pán)”也不會(huì)再有今天煩人的等待,與內(nèi)存同速。