omniture

重郵張清華:發(fā)展數(shù)據(jù)科學(xué)需要大數(shù)據(jù)試驗(yàn)場(chǎng)

2020-10-15 14:32 6261
近日,“浪潮云數(shù)智中國(guó)行-重慶站”現(xiàn)場(chǎng),重慶郵電大學(xué)計(jì)算機(jī)學(xué)院/人工智能學(xué)院執(zhí)行院長(zhǎng)張清華做了題為《人工智能發(fā)展的內(nèi)驅(qū)動(dòng)力》的主題演講。

北京2020年10月15日 /美通社/ -- 近日,“浪潮云數(shù)智中國(guó)行-重慶站”現(xiàn)場(chǎng),重慶郵電大學(xué)計(jì)算機(jī)學(xué)院/人工智能學(xué)院執(zhí)行院長(zhǎng)張清華做了題為《人工智能發(fā)展的內(nèi)驅(qū)動(dòng)力》的主題演講。張清華院長(zhǎng)分享了人工智能時(shí)代下數(shù)據(jù)、算法和算力的發(fā)展,尤其對(duì)人工智能時(shí)代下的“數(shù)據(jù)科學(xué)”做了精彩的解讀。

隨著計(jì)算機(jī)、互聯(lián)網(wǎng)、移動(dòng)互聯(lián)網(wǎng)與物聯(lián)網(wǎng)的發(fā)展,我們已經(jīng)進(jìn)入了以數(shù)據(jù)為主體的數(shù)字化進(jìn)程中,科學(xué)研究也已經(jīng)走向“數(shù)據(jù)科學(xué)”第四范式。數(shù)據(jù)是數(shù)字世界的基本要素,也是人工智能的生產(chǎn)資料。然而,目前我們對(duì)數(shù)據(jù)的挖掘與探索仍然停留在表層,并未發(fā)現(xiàn)數(shù)據(jù)本身的新規(guī)律、新知識(shí),并由此創(chuàng)造新的價(jià)值。面對(duì)數(shù)據(jù)的挑戰(zhàn),深化人工智能發(fā)展,重大的科學(xué)基礎(chǔ)設(shè)施建設(shè)必不可少。

將重慶郵電大學(xué)建設(shè)為“重慶市大數(shù)據(jù)智能化的一個(gè)實(shí)驗(yàn)場(chǎng)所、人才高地、科技高地”,是重慶市的重要戰(zhàn)略部署。目前,重慶郵電大學(xué)正加緊籌劃建設(shè)“大數(shù)據(jù)試驗(yàn)場(chǎng)”,推動(dòng)科學(xué)基礎(chǔ)設(shè)施的建設(shè),為重慶市以大數(shù)據(jù)智能化為引領(lǐng)的創(chuàng)新驅(qū)動(dòng)發(fā)展戰(zhàn)略提供強(qiáng)有力的基礎(chǔ)設(shè)施支撐。2020年7月,重慶郵電大學(xué)與浪潮攜手打造了計(jì)算性能達(dá)每秒千萬(wàn)億次規(guī)模的人工智能創(chuàng)新平臺(tái),作為重郵的核心算力底座,支撐起重郵的大數(shù)據(jù)智能化研究,切實(shí)推動(dòng)重慶市的智慧新基建發(fā)展與國(guó)家新一代人工智能創(chuàng)新發(fā)展試驗(yàn)區(qū)建設(shè)。

以下為張清華院長(zhǎng)演講實(shí)錄(節(jié)選):

數(shù)字世界來(lái)臨,數(shù)據(jù)成為生產(chǎn)資料

人工智能的三大要素是算法、算力和數(shù)據(jù)。其中,數(shù)據(jù)是人工智能時(shí)代的生產(chǎn)資料。那么我們?yōu)槭裁催M(jìn)入數(shù)字世界,被數(shù)據(jù)包圍?首先要提到的是計(jì)算機(jī)的發(fā)展,計(jì)算機(jī)令一切數(shù)字化成為可能,也讓高效計(jì)算成為可能,我們已經(jīng)身處數(shù)字化進(jìn)程中,是抵擋不住的潮流。第二,網(wǎng)絡(luò)的發(fā)明讓機(jī)器的互聯(lián)互通成為可能,讓信息高效匯聚成為可能。第三,移動(dòng)互聯(lián)網(wǎng)的發(fā)展使得我們的數(shù)據(jù)從固定終端轉(zhuǎn)移到移動(dòng)終端,變?yōu)槲覀兊氖謾C(jī)、iPad。第四,物聯(lián)網(wǎng)通過(guò)傳感器,使人與人之間、人與物之間、物與物之間構(gòu)建起萬(wàn)物互聯(lián)的數(shù)據(jù)世界,讓現(xiàn)實(shí)世界精確映射到數(shù)字世界成為可能。實(shí)際上我們每個(gè)人都是數(shù)字世界的最基本要素和數(shù)據(jù)生產(chǎn)者,每個(gè)人都在數(shù)字世界上對(duì)自己進(jìn)行畫像,最后匯聚成一個(gè)數(shù)字海洋,也就是我們今天所說(shuō)的“數(shù)字世界”。

在人類社會(huì)誕生前,世界上我只有一維空間,即物理空間。有人類社會(huì)后,我們說(shuō)形成了包含社會(huì)空間在內(nèi)的二維空間,現(xiàn)在我們給自己構(gòu)造了一個(gè)第三空間,就叫數(shù)字空間。在三維空間里,除了物理空間、社會(huì)空間,還有虛擬的數(shù)字空間。數(shù)字世界現(xiàn)在正在逐漸形成,其基本要素就是數(shù)據(jù),數(shù)字世界就是我們現(xiàn)實(shí)世界的基本映射,有人提出是孿生世界。我個(gè)人認(rèn)為,這個(gè)映射空間目前還不是孿生,未來(lái)可能構(gòu)建從物理世界到數(shù)字世界的雙生,可能那時(shí)候提“數(shù)字人”會(huì)更為準(zhǔn)確。


數(shù)據(jù)科學(xué)作為第四范式

2013年被稱為大數(shù)據(jù)元年,后來(lái)國(guó)家每年都在制定計(jì)劃推動(dòng)大數(shù)據(jù)發(fā)展,我們?nèi)绾沃卫頂?shù)據(jù)世界,如何應(yīng)用數(shù)據(jù)世界?對(duì)應(yīng)的就需要處理數(shù)據(jù)的科學(xué),因此,大數(shù)據(jù)戰(zhàn)略推出后,“數(shù)據(jù)科學(xué)”應(yīng)運(yùn)而生。

什么是數(shù)據(jù)科學(xué),我查了很多資料,但是沒(méi)有很準(zhǔn)確的定義。有人這樣說(shuō)過(guò),要成為一門科學(xué),背后一定要有基礎(chǔ)理論支撐。我們的人工智能發(fā)展得非常繁榮,然而,繁榮主要是在應(yīng)用端??梢哉f(shuō),治理數(shù)據(jù)的模型、方法都還在路上?,F(xiàn)在,應(yīng)用實(shí)踐已經(jīng)倒逼我們做理論研究、基礎(chǔ)理論分析。

科學(xué)研究的第一范式是實(shí)驗(yàn)科學(xué),第二范式是理論科學(xué),第三范式是計(jì)算科學(xué),第四范式就是數(shù)據(jù)密集型科學(xué),也即“數(shù)據(jù)科學(xué)”,它以數(shù)據(jù)挖掘?yàn)橐罁?jù),也就是數(shù)據(jù)世界形成后我們希望從數(shù)據(jù)當(dāng)中獲取其本身蘊(yùn)含的規(guī)律和價(jià)值。然而,目前我們?cè)跀?shù)字世界中能還原現(xiàn)實(shí)世界的規(guī)律,但是還沒(méi)有發(fā)現(xiàn),數(shù)據(jù)世界本身的新規(guī)律。

“數(shù)據(jù)科學(xué)”的特征我主要說(shuō)三個(gè)。第一是不在意數(shù)據(jù)的雜亂,而在意數(shù)據(jù)的量;第二是不要求數(shù)據(jù)精準(zhǔn),而強(qiáng)調(diào)數(shù)據(jù)面面俱到。面面俱到的含義不是涵蓋所有數(shù)據(jù),而是各個(gè)方面都要有代表性數(shù)據(jù),這就離不開概率論支持。第三是不追求因果關(guān)系,但重視統(tǒng)計(jì)規(guī)律。這意味著不只追求因果關(guān)系,更多在于追求關(guān)聯(lián)關(guān)系。

科學(xué)研究的前三種范式都屬于知識(shí)范式,它們的重要特征就是從數(shù)據(jù)特征里面挖掘出能夠被我們理解的知識(shí)。數(shù)據(jù)科學(xué)范式下,有一個(gè)不一樣的思維方式:我們是否可以挖掘出客觀存在但人類無(wú)法理解的知識(shí)呢?數(shù)據(jù)科學(xué)的內(nèi)涵知識(shí),是否可以通過(guò)數(shù)字世界的特殊方式直接解決問(wèn)題?我認(rèn)為數(shù)據(jù)科學(xué)范式下挖掘出來(lái)知識(shí),可能我們理解不了,但是機(jī)器能理解,這種規(guī)律應(yīng)該是數(shù)據(jù)范式下我們?nèi)ヌ剿骱退伎嫉摹?/p>

建設(shè)大數(shù)據(jù)試驗(yàn)場(chǎng)驅(qū)動(dòng)數(shù)據(jù)科學(xué)發(fā)展

要探索數(shù)據(jù)世界、治理數(shù)據(jù)世界,就必須發(fā)展“數(shù)據(jù)科學(xué)”,這是一個(gè)重要前提。每一個(gè)科學(xué)都需要探索,在探索過(guò)程中都需要做試驗(yàn)或者實(shí)驗(yàn)。試驗(yàn)是探索,實(shí)驗(yàn)是驗(yàn)證。我想,最重要的事情就是做“大數(shù)據(jù)試驗(yàn)場(chǎng)”。大數(shù)據(jù)試驗(yàn)場(chǎng)想做的就是驅(qū)動(dòng)數(shù)據(jù)科學(xué)發(fā)展,探索數(shù)字世界的奧秘,換一個(gè)角度看世界。

為什么要建大數(shù)據(jù)試驗(yàn)場(chǎng)呢?因?yàn)閿?shù)據(jù)孤島的存在,我們現(xiàn)在的一些數(shù)據(jù)挖掘方法,只能挖到一些很低端的淺層次的數(shù)據(jù),更深層次的怎樣進(jìn)行挖掘,需要新的挖掘方法和新的理論,就需要建設(shè)試驗(yàn)場(chǎng)。做一個(gè)比較淺顯易懂的對(duì)比方式,試驗(yàn)場(chǎng)跟礦場(chǎng)是類似的。


目前,重郵正在建設(shè)“大數(shù)據(jù)試驗(yàn)場(chǎng)”,我們建設(shè)大數(shù)據(jù)試驗(yàn)場(chǎng)的目的是探索數(shù)據(jù)科學(xué)本身的內(nèi)涵、探究數(shù)據(jù)科學(xué)本身規(guī)律,然后引導(dǎo)產(chǎn)業(yè)創(chuàng)新,引導(dǎo)行業(yè)的發(fā)展。我們?cè)诶顺钡纫恍┲髽I(yè)的指導(dǎo)下,構(gòu)建了千萬(wàn)元級(jí)的算力,但長(zhǎng)期目標(biāo)是打造示范性算力基礎(chǔ)設(shè)施,構(gòu)建大數(shù)據(jù)試驗(yàn)場(chǎng)基礎(chǔ)設(shè)施,在高校中打造算力平臺(tái)的典范,為重慶市實(shí)施大數(shù)據(jù)智能化發(fā)展作出貢獻(xiàn)。

最后,歡迎大家到重郵來(lái),也對(duì)本次2020浪潮云數(shù)智峰會(huì)的召開表示祝賀,謝謝大家!

消息來(lái)源:浪潮
China-PRNewsire-300-300.png
全球TMT
微信公眾號(hào)“全球TMT”發(fā)布全球互聯(lián)網(wǎng)、科技、媒體、通訊企業(yè)的經(jīng)營(yíng)動(dòng)態(tài)、財(cái)報(bào)信息、企業(yè)并購(gòu)消息。掃描二維碼,立即訂閱!
collection