摘要:11月30日-12月1日,中國IT界技術(shù)盛會——Hadoop與大數(shù)據(jù)技術(shù)大會將在京舉行。目前,Hadoop生態(tài)系統(tǒng),大數(shù)據(jù)行業(yè)應(yīng)用,NoSQL、NewSQL、SQL與大數(shù)據(jù),大數(shù)據(jù)共享平臺與實踐四大議題已經(jīng)確定,首批40位演講嘉賓及議題首次對外公布。
11月30日-12月1日,中國IT界技術(shù)盛會——Hadoop與大數(shù)據(jù)技術(shù)大會(Hadoop&BigData Technology Conference 2012,以下簡稱“HBTC 2012”)將在京舉辦。本次會議以“大數(shù)據(jù)共享與開放技術(shù)”為主題,邀請國內(nèi)外Hadoop及大數(shù)據(jù)技術(shù)應(yīng)用的產(chǎn)學(xué)界人士和實踐企業(yè),探討大數(shù)據(jù)技術(shù)生態(tài)系統(tǒng)的現(xiàn)狀和發(fā)展趨勢,并圍繞Hadoop與大數(shù)據(jù)熱點技術(shù)和應(yīng)用實踐進(jìn)行深入解析。
作為已成功舉辦了六屆的技術(shù)會議,Hadoop中國云計算大會曾邀請Apache軟件基金會主席Doug Cutting,威斯康星大學(xué)計算機系教授Miron Livny,Apache HBase Jerry Chen與Liyin Tan等數(shù)百位國內(nèi)外IT技術(shù)領(lǐng)軍人物擔(dān)任演講嘉賓。本屆HBTC 2012則匯聚了“Hadoop中國云計算大會”和“CSDN大數(shù)據(jù)技術(shù)大會”的精華,講師陣容、議題深度更為提升。目前,首批40位演講嘉賓及議題已經(jīng)確認(rèn)。
主會13位重磅講師 激揚技術(shù)與趨勢
HBTC 2012主會共邀請13位頂尖技術(shù)嘉賓。其中,MemSQL CTO&聯(lián)合創(chuàng)始人 Nikita Shamgunov擁有計算機科學(xué)本科、碩士和博士學(xué)位。在創(chuàng)建MemSQL之前,尼基塔(Nikita)曾在微軟公司擁有6年的SQL Server高級數(shù)據(jù)庫工程師的工作經(jīng)驗,并是多項專利的所有者。此外,他還是世界ACM編程競賽的冠軍。在HBTC 2012,他將以Beyond Hadoop為主題,并針對MemSQL在大數(shù)據(jù)中的作用、適用范圍和案例做純技術(shù)層面的經(jīng)驗分享。
10gen Deputy CTO Paul Pedersen同時也是Factery的創(chuàng)始人與CEO,擁有紐約大學(xué)博士學(xué)位和哈弗大學(xué)數(shù)學(xué)學(xué)士學(xué)位。Paul將詳細(xì)介紹MongoDB在大數(shù)據(jù)中的作用、適用范圍和案例,揭示數(shù)據(jù)庫應(yīng)用方面的最新技術(shù)發(fā)展和趨勢。
俄亥俄州立大學(xué)IEEE Fellow張曉東是工程領(lǐng)域的Robert M. Critchfield Professor,以及俄亥俄州立大學(xué)計算機科學(xué)與工程部主席。他畢業(yè)于北京工業(yè)大學(xué)電氣工程專業(yè),在科羅拉多大學(xué)獲得了計算機科學(xué)博士學(xué)位,是IEEE的合伙人。作為長期專注研究高性能計算以及分布式系統(tǒng),包括數(shù)據(jù)管理以及系統(tǒng)擴(kuò)展方面,龍星計劃的講師之一,張曉東將會為分布式應(yīng)用以及數(shù)據(jù)庫擴(kuò)展帶來新的理念分享。
中國移動通信研究院云計算研究所所長孫少陵將就中國移動“大云”應(yīng)用Hadoop技術(shù)應(yīng)用和實踐經(jīng)驗做深入分享。CCF大數(shù)據(jù)專家委員會李建中和CCF大數(shù)據(jù)專家委員會程學(xué)旗將分別就“大數(shù)據(jù)趨勢”和“大數(shù)據(jù)的十個問題和十個趨勢”做主題演講,更加深入地揭示大數(shù)據(jù)計算基本概念、重點研究問題和解決方案,產(chǎn)業(yè)趨勢。除此以外,還有來自Teradata、IBM、華為、VMware、英特爾的技術(shù)團(tuán)隊負(fù)責(zé)人的純技術(shù)性的分享與實踐。
四大技術(shù)分論壇 聚焦實踐和行業(yè)
HBTC 2012四個分論壇:“Hadoop生態(tài)系統(tǒng),大數(shù)據(jù)行業(yè)應(yīng)用,NoSQL、NewSQL、SQL與大數(shù)據(jù),大數(shù)據(jù)共享平臺與實踐”,全部以技術(shù)為主,是開發(fā)者獲得核心技術(shù)資料與寶貴實踐經(jīng)驗不容錯過的技術(shù)盛宴。
論壇一Hadoop生態(tài)系統(tǒng)匯聚業(yè)內(nèi)Facebook、騰訊、淘寶、Hortonworks、阿里巴巴、中國移動研究院、IBM、華為和VMware等一線專家,重在研討技術(shù)問題與解決方案,分享優(yōu)化方法與實踐經(jīng)驗。
其中,F(xiàn)acebook分布式系統(tǒng)專家,曾任職于微軟軟件開發(fā)部門,現(xiàn)Facebook軟件工程師Siying Dong將就“ Big Data的存儲和處理”做經(jīng)驗分享;騰訊趙偉將就“HIVE在騰訊分布式數(shù)據(jù)倉庫實踐”進(jìn)行分享;淘寶王琤主要討論“Hadoop Namenode性能診斷及優(yōu)化”,將目前淘寶hadoop集群現(xiàn)實遇到如namenode、鎖競爭、CPU熱點等導(dǎo)致的性能瓶頸等問題作深入分析,并將詳細(xì)介紹在namenode實現(xiàn),JVM層的各項優(yōu)化方法、實現(xiàn)及最終優(yōu)化效果。
Hortonworks核心技術(shù)人員戴建勇的主題為“Apache Pig的性能優(yōu)化”。作為一種面向數(shù)據(jù)流處理的類SQL語言,Apache Pig對用戶常用的數(shù)據(jù)操作做了相當(dāng)幅度的優(yōu)化。他將詳細(xì)介紹Apache Pig里采用的優(yōu)化技術(shù),包括全局排序,多種連接類型,Pig的序列化,多語句并行執(zhí)行等,并且對如何編寫更高效的Pig腳本提出建議。
阿里巴巴高級研發(fā)工程師梁李印會從“阿里Hadoop集群架構(gòu)及服務(wù)體系”入手,介紹阿里Hadoop集群架構(gòu)及服務(wù)體系,集群發(fā)展現(xiàn)狀,Hadoop版本特性及改進(jìn),集群服務(wù)模式及挑戰(zhàn),集群用戶門戶,以及集群核心業(yè)務(wù)架構(gòu)。此外,還有中國移動研究院的“HBase Coprocessor優(yōu)化與實驗”,IBM的“基于 HADOOP 技術(shù)的 IBM 大數(shù)據(jù)戰(zhàn)略”,華為的“HDFS Name Node High Availability”等更多技術(shù)揭秘與經(jīng)驗分享。
論壇二大數(shù)據(jù)行業(yè)應(yīng)用意在探討Hadoop發(fā)展前景,分享實戰(zhàn)成果。其中,IDG資本副總裁??鈺?ldquo;大數(shù)據(jù)商業(yè)模式”進(jìn)行探討;阿里代志遠(yuǎn)分享“海量數(shù)據(jù)分布式數(shù)據(jù)庫的探索:Wasp”的技術(shù)細(xì)節(jié);中國移動研究院云計算研究員鄧超關(guān)注“The Advance and Applications of Big Cloud based Parallel Data Mining Platform in CMRI”;Carbonite China技術(shù)總監(jiān)兼高級架構(gòu)師盧億雷將分享“Hadoop在網(wǎng)盤和在線備份的應(yīng)用與挑戰(zhàn)”,網(wǎng)易高級經(jīng)理蔡迎東的“大型內(nèi)容推薦系統(tǒng)實踐”與奇虎360系統(tǒng)部工程師趙健博的“Hbase系統(tǒng)在搜索網(wǎng)頁庫的應(yīng)用”和普澤天璣劉佳的“HBase用例分析”,VMware堵俊平的“Hadoop Virtualization Extensions”則將從分別從不同層面進(jìn)行各自的實戰(zhàn)分享。
論壇三NoSQL、NewSQL、SQL與大數(shù)據(jù)將圍繞數(shù)據(jù)庫技術(shù)進(jìn)行專業(yè)研討。其中,作為Apache HBase的PMC 32名成員之一,MTS 2 at EBay的Ted Yu會就“Hbase For Enterprise”做深入分享。他擁有14年軟件開發(fā)經(jīng)驗,以及超過兩年的HBase開發(fā)經(jīng)驗,并是HBase 0.96項目開發(fā)的核心參與者。目前正在關(guān)注用Protobuf序列化重寫RPC引擎;引入Write-Ahead-Log接口,使得能夠加載多種WAL實現(xiàn);開發(fā)表的快照功能等方面,技術(shù)實力雄厚。
甲骨文亞太研發(fā)中心研發(fā)經(jīng)理黃超“Oracle NoSQL技術(shù)與案例”,阿里王玉法(那巖)的“Tair存儲引擎之路”;華為高級技術(shù)經(jīng)理Anoop Sam John的“HBase Secondary Index”會就不同技術(shù)做深度研討,讓技術(shù)開發(fā)者不虛此行。
論壇四大數(shù)據(jù)共享平臺與實踐關(guān)注的是平臺技術(shù)與大數(shù)據(jù)應(yīng)用。其中,精誠資訊陳昭宇將就“企業(yè)應(yīng)用Hadoop的最佳模式”,京東商城架構(gòu)師李松林針對“電子商務(wù)中大數(shù)據(jù)技術(shù)”,阿里巴巴集團(tuán)數(shù)據(jù)交換平臺資深專家強琦(和仲)的方向是“大數(shù)據(jù)探索-阿里巴巴數(shù)據(jù)交換平臺”以及“IBM大數(shù)據(jù)在銀行業(yè)的應(yīng)用”,將為開發(fā)者描述行業(yè)中不同的應(yīng)用場景,揭示行業(yè)中的技術(shù)應(yīng)用現(xiàn)狀。
40位演講嘉賓并不是HBTC 2012的全部,確認(rèn)名單還在繼續(xù)。技術(shù)之外,中國智能交通CTO、鐵道部鐵道科學(xué)研究院、民生銀行、中國海關(guān)、國家電力中心、中石油、中石化信息中心CIO、教育醫(yī)療等行業(yè)信息化專家代表等也將融入HBTC 2012,分享行業(yè)最佳實踐經(jīng)驗。詳情請關(guān)注HBTC 2012官網(wǎng)。
嘉賓及議題附錄:
議題 演講嘉賓
MongoDB在大數(shù)據(jù)中的作用與最新技術(shù)發(fā)展 Paul Pedersen 10gen Deputy CTO
Half life of data value. Getting instant insight when your big data is the 'hottest' Nikita Shamgunov CTO & Co-Founder of MemSQL
HDFS Name Node High Availability Maheshwara Rao 華為Hadoop Committer
Accessible Big Data: Making Big Data easy to use 孔宇華 Teradata天睿公司大中華區(qū)Aster事業(yè)部總監(jiān)
Oracle NoSQL技術(shù)與案例 黃 超 甲骨文亞太研發(fā)中心研發(fā)經(jīng)理
Facebook開發(fā)HDFS和HBase的新進(jìn)展 Siying Dong Facebook軟件工程師
IBM大數(shù)據(jù)戰(zhàn)略分享 Tim Vincent IBM 信息管理VP
Fill in Missing Pieces for Hadoop 何京翔 英特爾亞太研發(fā)集團(tuán)總經(jīng)理
HDFS Name Node High Availability Maheshwara Rao 華為Hadoop Committer
大數(shù)據(jù)商業(yè)模式探討 ???IDG資本副總裁
HBase For Enterprise Ted Yu HBase Committer
大數(shù)據(jù)的十個問題和十個趨勢 程學(xué)旗 中科院計算所副總工程師
阿里Hadoop集群架構(gòu)及服務(wù)體系 梁李印 阿里巴巴高級研發(fā)工程師
Fill in Missing Pieces for Hadoop 戴金權(quán) 英特爾軟件和服務(wù)事業(yè)部首席工程師
Apache Pig的性能優(yōu)化 戴建勇 Hortonworks技術(shù)團(tuán)隊工程師
Hadoop在網(wǎng)盤和在線備份的應(yīng)用與挑戰(zhàn) 盧億雷 Carbonite China技術(shù)總監(jiān)兼高級架構(gòu)師
大數(shù)據(jù)探索——阿里巴巴數(shù)據(jù)交換平臺 強 琦 阿里巴巴集團(tuán)數(shù)據(jù)交換平臺資深專家
HBase Coprocessor優(yōu)化與實驗 郭磊濤 中國移動研究院,云計算研究員
The Advance and Applications of Big Cloud based Parallel Data Mining Platform in CMRI 鄧 超 中國移動研究院,云計算研究員
HBase Secondary Index Anoop Sam John 華為高級技術(shù)經(jīng)理
企業(yè)應(yīng)用Hadoop的最佳模式 陳昭宇 精誠資訊
Hadoop在大型內(nèi)容推薦系統(tǒng)中的應(yīng)用 蔡迎東 網(wǎng)易高級經(jīng)理
HIVE在騰訊分布式數(shù)據(jù)倉庫實踐分享 趙 偉 騰訊
Hadoop Namenode性能診斷及優(yōu)化 王 琤 淘寶
HBase用例分析 劉 佳 普澤天璣
海量數(shù)據(jù)分布式數(shù)據(jù)庫的探索:Wasp 代志遠(yuǎn) 阿里巴巴
Hbase系統(tǒng)在搜索網(wǎng)頁庫的應(yīng)用 趙健博 奇虎360系統(tǒng)部工程師
Tair存儲引擎之路 王玉法 阿里巴巴
“大云”數(shù)據(jù)倉庫在移動互聯(lián)網(wǎng)領(lǐng)域的最新實踐 齊 驥 中國移動研究院
電子商務(wù)中大數(shù)據(jù)技術(shù) 李松林 京東商城架構(gòu)師
技術(shù)為王,這將是中國開源界不容錯過的一場精彩的盛會!HBTC 2012——中國Hadoop與大數(shù)據(jù)技術(shù)大會,期待您的參與!