上海2018年7月27日電 /美通社/ -- 近日,由 Gartner 和七牛云聯(lián)合發(fā)布了一份《Five Key Essentials for the New Generation of Intelligent Video Cloud》白皮書報告,報告中針對各行業(yè)在視頻應(yīng)用領(lǐng)域升級過程中面臨的技術(shù)痛點及挑戰(zhàn),提出了構(gòu)建新一代視頻云的5個關(guān)鍵要素和相關(guān)參考標(biāo)準,并描述了智能視頻云如何以更便捷的服務(wù)和更低的成本幫助客戶加速升級。本文則對 Gartner 和七牛云的白皮書報告進行了詳細編譯。
以下為譯文:
一、導(dǎo)語
過去十年里,中國移動互聯(lián)網(wǎng)的高速發(fā)展,帶動了各個產(chǎn)業(yè)IT基礎(chǔ)架構(gòu)的擴展和升級:
本文介紹各行業(yè)在視頻應(yīng)用領(lǐng)域的升級過程中,主要面臨的技術(shù)痛點和挑戰(zhàn),并提出了構(gòu)建新一代視頻云的5個關(guān)鍵要素和相關(guān)參考標(biāo)準,描述了智能視頻云如何以更便捷的服務(wù)和更低的成本幫助客戶加速升級。未來視頻的應(yīng)用的場景和領(lǐng)域可能會成為企業(yè)產(chǎn)品或營銷服務(wù)中核心的環(huán)節(jié),而且它本身的規(guī)模變化也非常符合互聯(lián)網(wǎng)中的馬太效應(yīng),因此企業(yè)都需要提前為自己未來海量的富媒體素材做好充分準備,避免數(shù)據(jù)失控。
二、各行業(yè)在視頻時代的新興場景
1、安防監(jiān)控
根據(jù) Markets&Markets 的調(diào)查結(jié)果,2017年至2022年期間,全球監(jiān)控視頻市場年復(fù)合增長率將達15.4%,2022年將增至約756億美元的規(guī)模。視頻監(jiān)控廣泛應(yīng)用于各類場合,包括:
最近兩年來,以幼兒園、學(xué)校代表的公共區(qū)域場所監(jiān)控提出了更高的要求:
而道路交通和城市安全的監(jiān)控,除了傳統(tǒng)的車輛違章監(jiān)控和識別,行人的違章也逐步納入到了監(jiān)控的體系中,如:
由此可以看到,視頻監(jiān)控領(lǐng)域正在面臨著產(chǎn)業(yè)升級,如何做到公網(wǎng)穩(wěn)定地訪問,產(chǎn)生的海量的圖像和視頻數(shù)據(jù)如何更好地存儲、分析和檢索,是一項巨大的挑戰(zhàn)。
2、在線教育
近年來,在線教育發(fā)展異?;馃幔没ヂ?lián)網(wǎng)音視頻技術(shù),解決了優(yōu)質(zhì)教育資源傳遞的時空限制,主要體現(xiàn)形式如下:
如何解決學(xué)生觀看直播的卡頓問題,如何進一步降低視頻互動的延時,提高老師和學(xué)生的體驗,顯得至關(guān)重要。另外,隨著人工智能的發(fā)展,視頻技術(shù)如何更好地借助 AI 技術(shù),也成為在線教育領(lǐng)域大家更為關(guān)注的方向,如:
3、廣電新媒體
隨著互聯(lián)網(wǎng)直播興起,各類廣電平臺想要做出一檔可看且互動性強的直播節(jié)目,除了要精心編排節(jié)目內(nèi)容,還要特別重視音視頻及互動方式的呈現(xiàn)。顯然,在新媒體時代下,傳統(tǒng)的廣電方案具有一定的局限性:
面對這些局限,廣電行業(yè)迫切需要全新的視頻系統(tǒng),為消費者提供高畫質(zhì)、強互動的視頻娛樂體驗和可量化的精確數(shù)據(jù)管理:
如何實現(xiàn)導(dǎo)播內(nèi)容的實時切換,如何保證廣電內(nèi)容實時傳輸,如何讓廣電傳媒的廣告價值較大化,如何制作低成本、高質(zhì)量的節(jié)目,這對廣電新媒體來說均是急需解決的難題。
4、智慧法庭
2016年7月1日起,較高人民法院所有公開開庭案件均有網(wǎng)上直播,所有直播視頻均有視頻存檔,公眾可在線觀看。截至2018年3月,全國范圍內(nèi)的庭審直播共累計66萬余場,累計訪問近50億人次。智慧法庭充分運用互聯(lián)網(wǎng)、大數(shù)據(jù)、云計算、人工智能等先進信息技術(shù),支持全業(yè)務(wù)網(wǎng)上辦理、全流程依法公開、全方位智能服務(wù):
基于視頻及文書,結(jié)合人工智能計算機視覺技術(shù),讀取、分析電子化卷宗,抓取重要因素,并分類標(biāo)注。例如把犯罪動機、犯罪時間、犯罪工具等 -- 以不同顏色打上標(biāo)簽,并予以比對分析。
建設(shè)智慧法庭,如何保障開庭審訊直播視頻的實時傳輸,如何存儲海量直播視頻用于點播回放,如何基于廣泛的視頻內(nèi)容進行智能分析,對視頻基礎(chǔ)設(shè)施的可靠性提出了更高的要求和挑戰(zhàn)。
5、遠程醫(yī)療
當(dāng)前醫(yī)療資源還存在著地區(qū)分布不均問題,醫(yī)療專家可以通過在線直播、實時音視頻進行跨區(qū)域互動會診:
遠程醫(yī)療這一概念被提出后,已經(jīng)被廣泛應(yīng)用。但是,如何提高視頻傳輸性能,如何確保家庭、基層醫(yī)療機構(gòu)和戶外應(yīng)急的遠程醫(yī)療快速接入,是當(dāng)前的遠程醫(yī)療業(yè)務(wù)系統(tǒng)面臨的主要挑戰(zhàn)。
從以上列舉的幾個行業(yè)新興場景可以看出,在產(chǎn)業(yè)升級的過程中,他們都面臨著巨大的技術(shù)和資源挑戰(zhàn)。大部分企業(yè)無法在短時間內(nèi)構(gòu)建有效的相關(guān)視頻服務(wù)能力,因此如何選擇和利用公有云的相關(guān)視頻服務(wù),快速滿足業(yè)務(wù)的升級需求,顯得至關(guān)重要。
三、智能視頻云的關(guān)鍵要素
為了滿足各行業(yè)在視頻時代新的需求和挑戰(zhàn),智能視頻云至少需要擁有以下5個關(guān)鍵要素:
1、穩(wěn)定的網(wǎng)絡(luò)傳輸與分發(fā):直播延遲不高于1s,互動延遲不高于150ms
2、可擴展的海量存儲服務(wù):可以實現(xiàn)業(yè)務(wù)層無感知PB級擴容
3、云端媒體的編輯處理:可以在數(shù)秒內(nèi)創(chuàng)建獨立計算實例,執(zhí)行自定義媒體編輯操作
4、視頻內(nèi)容的智能分析:視頻內(nèi)容識別率高于95%
5、完備的權(quán)限控制:徹底杜絕非法拷貝,秒級封禁盜鏈流量
要素1:穩(wěn)定的網(wǎng)絡(luò)傳輸與分發(fā):提供流暢的觀看體驗與低延遲的互動
要素2:可擴展的海量存儲服務(wù):高可靠易擴展的數(shù)據(jù)安全保障
要素3:端媒體的編輯處理:快捷多用途云端視頻編輯
要素4:視頻內(nèi)容的智能分析:結(jié)合人工智能發(fā)揮視頻數(shù)據(jù)的較大價值
要素5:完備的權(quán)限控制:杜絕非法拷貝與盜鏈
根據(jù)以上5個關(guān)鍵要素,七牛云認為一套完整的智能視頻云需要由以下模塊組成:
四、智能視頻云的成本優(yōu)勢:
智能視頻云不僅在技術(shù)能夠完全滿足各行業(yè)在視頻時代的新需求,相比自主研發(fā),還能為企業(yè)大幅節(jié)省研發(fā)成本和運營成本。
面對高昂的成本,視頻云服務(wù)在提供了豐富產(chǎn)品的同時,還具有簡單易用、可彈性擴展、維護成本低的特點。智能視頻云服務(wù)通過提供通用且易于根據(jù)具體業(yè)務(wù)定制的技術(shù)系統(tǒng),大大降低了行業(yè)應(yīng)用的開發(fā)周期與成本開銷,同時視頻云的多個模塊均可私有或混合部署,在保障企業(yè)數(shù)據(jù)安全的同時,獲得和公有云一樣的穩(wěn)定性、可靠性和靈活性。
五:AI在智能視頻云的增值應(yīng)用
在智能視頻云的技術(shù)和成本優(yōu)勢背后,人工智能,尤其是計算機視覺技術(shù)的深度應(yīng)用發(fā)揮了巨大的作用。在七牛云整個智能視頻云系統(tǒng)中,計算機視覺技術(shù)在諸多環(huán)節(jié)取代了人工操作,極大地提高了視頻內(nèi)容處理的效率。通過完全不同于傳統(tǒng)數(shù)據(jù)分析的角度,實現(xiàn)了先前難以想象的數(shù)據(jù)分析應(yīng)用。
1、視頻內(nèi)容識別:自動識別視頻畫面信息,從標(biāo)簽庫中匹配對應(yīng)標(biāo)簽
作為計算機視覺基礎(chǔ)模型層中重要的幾項技術(shù),人臉識別、物體識別、場景識別等技術(shù)在安防、廣電、教育等領(lǐng)域的眾多場景中有廣泛的應(yīng)用場景。
例如在安防行業(yè),擁有人臉識別、動作追蹤等功能的高清攝像頭,能根據(jù)監(jiān)控范圍內(nèi)人物的動作并判斷其行為,對具有可疑行為的人觸發(fā)自動報警。當(dāng)智能攝像頭與公安部門的在逃嫌犯資料庫匹配之后,能在機場、火車站等人流密集場所配合警方識別可疑人員,大幅提升破案、抓捕效率。
2、視頻內(nèi)容結(jié)構(gòu)化:可以像搜索文本文件一樣搜索視頻文件中的信息
計算機視覺視頻結(jié)構(gòu)化相比人工標(biāo)注具有識別范圍廣、準確性好、學(xué)習(xí)模型不斷迭代、GPU機器效率高、成本低等一系列明顯優(yōu)勢。經(jīng)標(biāo)注后的視頻能夠在遠程醫(yī)療、在線教育、廣電等行業(yè)發(fā)揮巨大作用。
例如,遠程醫(yī)療行業(yè)擁有的存量和新增影像資料遠遠超出人工標(biāo)注的能力范圍,想要發(fā)揮醫(yī)療視頻資料的較大價值,需要根據(jù)不同類別將視頻和圖片進行分類。通過人工智能高效完成視頻精確分類后,就能像搜索文本文件一樣搜索視頻文件中的關(guān)鍵信息,進行更有效的利用,真正將醫(yī)療大數(shù)據(jù)變?yōu)獒t(yī)療知識圖譜。
3、視頻內(nèi)容審核:從視頻中識別敏感信息,提升審核效率
如今,圖片和視頻取代文字成為主流的傳播方式,針對圖片和視頻的內(nèi)容審核正變得越來越重要。然而人工審核不僅會造成高企的人力成本,其效率和準確性也很難滿足當(dāng)下巨大的視頻數(shù)據(jù)量帶來的審核需求。
例如在廣電行業(yè),視頻內(nèi)容鑒黃、鑒暴恐、政治人物識別等工作過去均由人工完成。隨著計算機視覺技術(shù)的日漸成熟,利用機器代替人工進行絕大部份的內(nèi)容審核工作,成為了視頻時代的提高審核效率的不二之選。憑借計算機視覺技術(shù)帶來的審核效率革命,鑒黃、鑒暴恐、政治人物識別將不再是廣電行業(yè)的難題。
4、視頻內(nèi)容推薦:可根據(jù)用戶消費視頻習(xí)慣,實現(xiàn)精細化運營
除了能夠高效完成視頻結(jié)構(gòu)化和內(nèi)容審核工作,計算機視覺技術(shù)還能在業(yè)務(wù)層面成為內(nèi)容運營的創(chuàng)新引擎,實現(xiàn)更多個性化產(chǎn)品需求。
同樣在廣電行業(yè),例如在完成視頻內(nèi)容結(jié)構(gòu)化之后,運營者可以根據(jù)用戶收看行為記錄進行智能內(nèi)容推薦,甚至在視頻的特定時間段和畫面的特定位置實現(xiàn)廣告定向投放,較大化提升廣告轉(zhuǎn)化效果。智能視頻內(nèi)容推薦能夠幫助內(nèi)容運營人員以較高效率實現(xiàn)高水平的用戶精細化運營。
六、借助靈活的智能視頻云從容面對未來產(chǎn)業(yè)升級的未知挑戰(zhàn)
未來,很少有企業(yè)能脫離互聯(lián)網(wǎng)而獨立存在,因此企業(yè)數(shù)據(jù)的總量會不斷增加,對應(yīng)產(chǎn)生的數(shù)據(jù)價值甚至負擔(dān)也會同步提升。每個企業(yè)都需要擁有對于文件和富媒體素材(包含海量圖片,視頻,音頻)的使用和存儲的彈性能力,但只有極少數(shù)企業(yè)才需要擁有自建視頻云的能力和資源,大部分企業(yè)只需要借助一套穩(wěn)定并可持續(xù)升級的視頻云平臺,迎接未來產(chǎn)業(yè)中不斷變化和升級的未知挑戰(zhàn)。
報告出處:
Gartner白皮書英文版鏈接:https://www.gartner.com/technology/media-products/newsletters/qiniu/1-4UWO347/index.html
Gartner白皮書中文版鏈接:https://www.qiniu.com/products/qavs