深圳2018年3月8日電 /美通社/ -- 終端人工智能解決方案領(lǐng)導(dǎo)企業(yè)耐能 (Kneron) 正式發(fā)布 Kneron NPU IP 神經(jīng)網(wǎng)絡(luò)處理器系列 (Kneron NPU IP Series),是針對終端設(shè)備所設(shè)計(jì)的專用人工智能處理器 IP。Kneron NPU IP 系列包括三款產(chǎn)品,分別為超低功耗版 KDP 300、標(biāo)準(zhǔn)版 KDP 500、以及高效能版 KDP 700,可滿足智能家居、智能安防、智能手機(jī),以及各種物聯(lián)網(wǎng)設(shè)備的應(yīng)用。全系列產(chǎn)品具備低功耗、體積小的特性,且提供強(qiáng)大的運(yùn)算能力。別于市面上用于人工智能的處理器,其功耗動(dòng)輒數(shù)瓦起,Kneron NPU IP 的功耗為100毫瓦 (mW) 等級,針對智能型手機(jī)臉部識別專用的 KDP 300,功耗甚至不到5毫瓦(注一)。
Kneron 創(chuàng)始人暨 CEO 劉峻誠表示:「要在終端設(shè)備上進(jìn)行人工智能運(yùn)算,同時(shí)滿足功耗與效能需求是首要考慮,Kneron NPU IP 實(shí)現(xiàn)了這樣的目標(biāo),為終端人工智能帶來革命性的發(fā)展。Kneron 自2016年推出該公司首款終端設(shè)備專用的人工智能處理器 NPU IP 后,就不斷改善其設(shè)計(jì)與規(guī)格,并針對不同產(chǎn)業(yè)應(yīng)用進(jìn)行優(yōu)化。我們很高興推出全系列新一代產(chǎn)品,同時(shí)宣布 KDP 500 已獲得客戶采用,于第二季進(jìn)入量產(chǎn)制造 (Mask tape-out) 階段。」
Kneron NPU IP 是針對終端設(shè)備所設(shè)計(jì)的專用人工智能處理器,讓終端設(shè)備在離線環(huán)境下,就能運(yùn)行 ResNet、YOLO 等深度學(xué)習(xí)網(wǎng)絡(luò)。Kneron NPU 為完整的終端人工智能硬件解決方案,包含硬件 IP、編譯程序 (Compiler) 以及模型壓縮 (Model compression) 三大部分,可支持各種主流的卷積神經(jīng)網(wǎng)絡(luò) (Convolutional Neur al Networks,CNN) 模型,如 Resnet-18、Resnet-34、Vgg16、GoogleNet、以及 Lenet 等,以及支持主流深度學(xué)習(xí)框架,包括 Caffe、Keras 和 TensorFlow。
Kneron NPU IP 功耗為100毫瓦等級,超低功耗版的 KDP 300 甚至不到5毫瓦,全系列產(chǎn)品的每瓦效能在1.5 TOPS/W以上(注二),由于采用了多項(xiàng)獨(dú)家技術(shù),因此能實(shí)現(xiàn)低功耗、高運(yùn)算力的需求。在架構(gòu)設(shè)計(jì)上,運(yùn)用卷積核拆分 (Filter decomposition) 技術(shù),將大卷積核的卷積運(yùn)算區(qū)塊分割成多個(gè)小卷積運(yùn)算區(qū)塊分別進(jìn)行運(yùn)算,然后結(jié)合可重組硬件卷積加速 (Reconfigurable Convolution Acceleration) 技術(shù),將多個(gè)小卷積運(yùn)算區(qū)塊的運(yùn)算結(jié)果進(jìn)行融合,以加速整體運(yùn)算效能。通過 Kneron 先進(jìn)的壓縮技術(shù),則能將未經(jīng)優(yōu)化的模型壓縮數(shù)十倍。內(nèi)存分層儲存技術(shù) (Multi-level caching) 可減少占用 CPU 資源以及降低數(shù)據(jù)傳輸量,進(jìn)一步提升整體運(yùn)作效率。此外,Kneron NPU IP 能結(jié)合 Kneron 影像識別軟件,提供實(shí)時(shí)識別分析、快速響應(yīng),不僅更穩(wěn)定,也能滿足安全隱私需求。由于軟硬件可緊密整合,讓整體方案體積更小、功耗更低,以協(xié)助產(chǎn)品快速開發(fā)。
Kneron NPU IP 產(chǎn)品系列介紹:
1. NPU IP- KDP 300 低功耗版
鎖定手機(jī)3D臉部識別應(yīng)用,可進(jìn)行3D結(jié)構(gòu)光與來自雙鏡頭的立體影像識別分析,讓真人臉部識別更快速精準(zhǔn)。KDP 300 亦適用于需要超低功耗的終端設(shè)備,該處理器包含運(yùn)算與靜態(tài)隨機(jī)存取內(nèi)存 (SRAM) 的功耗不到5毫瓦。
2. NPU IP- KDP 500 標(biāo)準(zhǔn)版
可進(jìn)行快速實(shí)時(shí)、大規(guī)模的臉部、手勢、身體識別與分析,以及深度學(xué)習(xí)。適用于智能家居、智能安防等領(lǐng)域。運(yùn)算能力可達(dá)152 GOPS (500MHz) (每秒十億次運(yùn)算),功耗僅有100毫瓦。
3. NPU IP- KDP 700 高效能版
能處理更進(jìn)階與復(fù)雜的人工智能運(yùn)算,以及深度學(xué)習(xí)推理應(yīng)用,可應(yīng)用在高階智能型手機(jī)、機(jī)器人、無人機(jī)、智能監(jiān)控設(shè)備等。KDP 700 具有優(yōu)異的運(yùn)算能力,信息吞吐量可高達(dá)4.4 TOPS (1GHz) (每秒萬億次運(yùn)算),功耗為300~500毫瓦。
注一:應(yīng)用條件為 CNN slice size 150x150、CNN frame rate 5fps、main frequency 20Mhz 的計(jì)算結(jié)果。 |