omniture

神策數(shù)據(jù):埋點套路深,千萬別掉“坑”

北京2017年3月20日電 /美通社/ --為什么要埋點?埋點如同裝在智能機器人身上的傳感器,在機器人研發(fā)過程中,技術人員將內傳感器和電機、軸、手臂、手腕等關鍵部位安裝在一起,實時監(jiān)控機器人的位置、速度、力度的測量,判斷機器人的穩(wěn)定性與風險,最終實現(xiàn)伺服控制。傳感器是機器人的埋點,網(wǎng)站與APP也需要如此埋點,埋點是數(shù)據(jù)采集、分析與數(shù)據(jù)驅動的基礎。神策數(shù)據(jù)撰文針對埋點常見三大誤區(qū):埋點與數(shù)據(jù)采集、數(shù)據(jù)分析的關系?如何規(guī)避埋點混亂?追求精益化數(shù)據(jù)分析,埋點方式如何選擇?這三方面進行剖析。

誤區(qū)1:重分析,輕采集!

在追求精益管理的道路上,大多企業(yè)深知數(shù)據(jù)驅動是第一生產力。然而,在企業(yè)搭建數(shù)據(jù)分析平臺,或選型第三方數(shù)據(jù)分析平臺時,經常會陷入“重分析,輕采集”的誤區(qū)。

數(shù)據(jù)分析是實現(xiàn)數(shù)據(jù)驅動的前提,固然重要。而數(shù)據(jù)分析的深度取決于數(shù)據(jù)采集的質量,顧此失彼,數(shù)據(jù)驅動道路只能越走越窄。神策數(shù)據(jù)創(chuàng)始人&CEO桑文鋒多次強調,數(shù)據(jù)采集應該遵循“大”、“全”、“細”、“實”四字法則。

  • “大”強調宏觀的“大”,而非物理的“大”。大數(shù)據(jù)不是一味追求數(shù)據(jù)量的“大”,比如每天各地級市的蘋果價格數(shù)據(jù)統(tǒng)計只有2MB,但基于此研發(fā)出一款蘋果智能調度系統(tǒng),就是一個大數(shù)據(jù)應用;
  • “全”強調多種數(shù)據(jù)源。大數(shù)據(jù)采集講求全量,而不是抽樣。除了采集客戶端數(shù)據(jù),還需采集服務端日志、業(yè)務數(shù)據(jù)庫,以及第三方服務等數(shù)據(jù),全面覆蓋;
  • “細”強調多維度數(shù)據(jù)采集,即把事件的維度、屬性、字段等都進行采集。如電商行業(yè)“加入購物車”的事件,除了采集用戶的click數(shù)據(jù),還應采集用戶點擊的是哪個商品、對應的商戶等數(shù)據(jù),方便后續(xù)交叉分析;
  • “時”強調數(shù)據(jù)的時效性。顯然,具有時效性的數(shù)據(jù)才有參考價值。

總之,埋點混亂、采集無序則根基不穩(wěn),令數(shù)據(jù)驅動的實現(xiàn)如“空中樓閣”。只有將數(shù)據(jù)采集和建模等基礎搭建好,數(shù)據(jù)驅動才能真正落地。

誤區(qū)2:夯實數(shù)據(jù)基礎,無埋點優(yōu)越于代碼埋點?

數(shù)據(jù)基礎夯實與否,取決于數(shù)據(jù)的采集方式。埋點方式多種多樣,按照埋點位置不同,可以分為前端(客戶端)埋點與后端(服務器端)埋點。其中無埋點是目前較為流行的前端埋點方式之一。

“無埋點”概念已爛大街,而在實際進行事件設計與實施的過程中,技術人員有道不盡的愛恨情仇:一方面,無埋點神秘無比,甚至被譽為“齊全、較便捷、界面友好、技術門檻低”的數(shù)據(jù)采集方式;另一方面,運營人員又發(fā)出“為何所采數(shù)據(jù)與業(yè)務數(shù)據(jù)庫數(shù)值相差這么大?”等各種抱怨。簡言之,無埋點采用“全部采集,按需選取”的形式,對頁面中所有交互元素的用戶行為進行采集,通過界面配置來決定哪些數(shù)據(jù)需要進行分析,實質與“全埋點”并無無實質差異。

圖1:無埋點的優(yōu)劣勢分析
圖1:無埋點的優(yōu)劣勢分析

為解釋頗具迷惑性的無埋點概念,筆者總結了其優(yōu)勢與劣勢,優(yōu)勢包括:

1、可視化展示界面最基本度量,滿足基本數(shù)據(jù)分析需求。無埋點可視化展現(xiàn)界面PV、UV等網(wǎng)站或APP分析的最基本度量,告訴運營人員每個控件被點擊的概率是多大,哪些控件值得做更進一步的分析等。如此有助于企業(yè)了解用戶行為,為進一步數(shù)據(jù)分析指明方向。

2、技術門檻低,使用與部署較簡單。無埋點極大程度避免了因需求變更、埋點錯誤等原因導致的重新埋點繁復工作。

3、用戶友好性強。運營人員可以直接應用手指或者鼠標進行操作,自動向服務器發(fā)送數(shù)據(jù),避免手工埋點的失誤。

然而,作為前端埋點的方式之一,無埋點有先天缺陷,帶來易用性的同時,也犧牲部分數(shù)據(jù)的采集深度。無埋點的劣勢如下:

1、無埋點只能采集到用戶交互數(shù)據(jù),且適合標準化的采集,自定義屬性的采集需要代碼埋點來輔助。

每個用戶的交互行為均有許多屬性,無埋點無法深入到更細、更深的粒度。例如在電商行業(yè)中,用戶點擊“購物車”是一次交互行為,無埋點會忽略掉用戶信息、商品品類等其它維度信息,此時需要配合代碼埋點來輔助數(shù)據(jù)采集;再如用戶上滑屏幕時,內容瀑布流的底部載入、商品或廣告的加載展示、下拉菜單中下拉內容的數(shù)據(jù)點擊等情況,這類自定義行為的采集需要代碼埋點輔助實現(xiàn)采集。

由于無埋點僅適合標準的方案采集,一些數(shù)據(jù)分析平臺也開始支持用戶為每個event添加自定義屬性,如此能大大擴展事件分析的效能。值得一提的是,神策數(shù)據(jù)為用戶提供的自定義屬性無數(shù)量限制。

2、無埋點兼容性有限。

例如在安卓系統(tǒng)進行埋點時,不同工程師可能會給APP界面中相同的button起不同名稱的ID,當運營人員想篩選出所需數(shù)據(jù)時,不同名稱會給運營人員帶來困擾。另外,由于目前第三方框架較多,如RN框架,容易造成無埋點兼容性問題。

3、無埋點具有前端埋點的固有缺陷。

無埋點是前端數(shù)據(jù)采集方式之一,因此具有前端埋點的天然缺陷,如數(shù)據(jù)采集不全面、傳輸時效性較差、數(shù)據(jù)可靠性無法保障等問題。無埋點的技術原理依賴網(wǎng)站或者APP后端技術開發(fā)的嚴謹性與規(guī)范性、網(wǎng)絡狀態(tài)、網(wǎng)絡口徑等因素。

總之,數(shù)據(jù)采集方式決定所采集到用戶行為數(shù)據(jù)的深度和粒度。夯實數(shù)據(jù)基礎,無埋點需要配合前端代碼埋點實現(xiàn),而前端數(shù)據(jù)采集的固有劣勢,應該結合后端埋點完成。數(shù)據(jù)采集不準、不全、不細容易讓后續(xù)數(shù)據(jù)分析工作陷入“巧婦難為無米之炊”的困境。

誤區(qū)3:忽略業(yè)務需求,埋點方式隨波逐流!

行業(yè)差異性明顯、企業(yè)實際需求不同,因此埋點方式也應有所不同。究竟該如何科學采集數(shù)據(jù)?要真正實現(xiàn)精細化運營,企業(yè)數(shù)據(jù)采集所采用的埋點方式不應“千企一面”,而應該“因企而異”。

1、適合前端埋點的企業(yè)業(yè)務需求

無論是自建數(shù)據(jù)分析平臺,還是采用第三方數(shù)據(jù)分析工具,梳理企業(yè)需求是第一步,隨后按照企業(yè)需求完成事件和埋點方案的設計,這也正是神策數(shù)據(jù)為客戶提供多維度數(shù)據(jù)分析的根基與前提。一般而言,以全埋點(無埋點)為典型代表的前端埋點方案,適合有以下需求的企業(yè)。

(1) 處于運營初級階段,產品功能相對簡單

如閱讀類、詞典類工具性APP的企業(yè)客戶,在其發(fā)展初期的產品運營階段,產品功能較為基礎,無明確業(yè)務數(shù)據(jù)、交易數(shù)據(jù),僅通過UV、PV、點擊量等基本指標分析即可滿足需求。由于神策分析(Sensors Analytics)支持全埋點,SDK支持默認采集APP或者網(wǎng)頁瀏覽頁面、激活、啟動等前端數(shù)據(jù),這類客戶可以基于此衡量用戶留存以及活躍度。如圖2,神策數(shù)據(jù)某廣告客戶了解用戶渠道來源,并判斷不同渠道和不同推廣方式的投放效果

圖2:不同渠道和推廣方式的效果分析
圖2:不同渠道和推廣方式的效果分析

(2) 需要分析與后端沒有交互的前端行為

若運營人員工作需要判斷前端界面設計是否合理,是必須采用前端埋點方案的。這也是后端代碼埋點無法完全代替全埋點的原因。

2、強烈建議后端埋點的業(yè)務需求

除了支持“前端埋點”(全埋點)方式,神策數(shù)據(jù)為保證數(shù)據(jù)采集做到“大、全、細、時”,更推薦“后端埋點”:當前后端都可以實現(xiàn)數(shù)據(jù)采集時,應優(yōu)先考慮后端(代碼)埋點,尤其在各行業(yè)中有特殊業(yè)務需求的數(shù)據(jù),更是強烈建議通過后端(代碼)埋點方式采集。總的來說,后端(代碼)埋點,或者“后端(代碼)埋點+全埋點”方案,適合有以下需求的企業(yè)。

(1) 追求精細化運營,需要進行多維數(shù)據(jù)分析的企業(yè)

更多的企業(yè)有精細化運營的訴求,科學埋點為運營人員后續(xù)進行多維度分析提供保障。以神策數(shù)據(jù)客戶為例,《迷城物語》是玩心(上海)網(wǎng)絡科技有限公司所研發(fā)游戲之一,首日即在各地區(qū)App Store和Google Play商店登頂并持續(xù)霸榜。其技術負責人馬宗驥,在近日公開分享數(shù)據(jù)驅動游戲設計中介紹:在游戲領域想實現(xiàn)實現(xiàn)精準運營,進行多維數(shù)據(jù)分析應該優(yōu)先考慮后端埋點,單純依賴前端數(shù)據(jù)采集有許多弊端。

例如,有時玩家已經退出游戲,但是鏈接還在,則前端采集不準,此時PCU數(shù)據(jù)無法正確衡量服務器的負載情況、數(shù)據(jù)庫的壓力情況等,而通過后端代碼埋點解決了這一問題。再如,他介紹:“NPC(非玩家控制角色)狀態(tài)、副本狀態(tài)、經濟系統(tǒng)實時狀態(tài)等統(tǒng)計類數(shù)據(jù),這些是前端埋點無法統(tǒng)計到的,而在后端采集數(shù)據(jù)可根據(jù)實際情節(jié)靈活完成數(shù)據(jù)統(tǒng)計工作?!比鐖D3,在神策分析平臺上,幫助運營人員精準找到游戲流失點。在100~110級流失的玩家所操控的角色大多停留在“打怪”動作上,機械地打怪練級,玩家開始感覺枯燥甚至疲憊。找到這一“流失點”后,《迷城物語》運營人員可以適當調整該關卡的怪物數(shù)量,并增加新鮮因素,從而平衡游戲趣味性和玩家精力。

圖3:《迷城物語》玩家“流失點”分析
圖3:《迷城物語》玩家“流失點”分析

(2) 包含用戶資產數(shù)據(jù)、用戶賬戶體系相關數(shù)據(jù)、風控輔助數(shù)據(jù)等重要業(yè)務數(shù)據(jù)的網(wǎng)站或APP的企業(yè)。

如電商客戶、互聯(lián)網(wǎng)金融包含用戶認證身份信息、手機號碼、充值賬戶信息等數(shù)據(jù),前端數(shù)據(jù)無法進行深入分析。再如,在互聯(lián)網(wǎng)金融企業(yè),較大痛點莫過于揪出“羊毛黨”了?!把蛎h”手里握著大量的代理IP、手機虛擬號。這一群體特征十分明顯,通常是經過注冊、領取福利、流失。這就需要運營人員從IP、設備信息、注冊信息、活躍度等進行多維度分析。用戶留存是互聯(lián)網(wǎng)金融企業(yè)判斷客戶是否是“羊毛黨”的方式之一。如圖4,在神策分析平臺上,一般用戶完成新手項目(領取福利后),未進行第二次投資,則可能是“羊毛黨”成員,在該平臺上點擊相關數(shù)字,人員明細會詳細展示出來。

圖4:“羊毛黨”用戶甄別 -- 留存數(shù)據(jù)細查
圖4:“羊毛黨”用戶甄別 -- 留存數(shù)據(jù)細查

 

(3) 對數(shù)據(jù)安全要求比較高的企業(yè)

    從后端采集數(shù)據(jù),例如采集后端的日志,實質上是將數(shù)據(jù)采集的傳輸與加密交給了產品本身,認為產品本身的后端數(shù)據(jù)是可信的。而后端采集數(shù)據(jù)到分析系統(tǒng)中則是通過內網(wǎng)進行傳輸,這個階段不存在安全和隱私性問題。同時,內網(wǎng)傳輸基本不會因為網(wǎng)絡原因丟失數(shù)據(jù),所以傳輸?shù)臄?shù)據(jù)可以非常真實地反應用戶行為在系統(tǒng)中的真實體現(xiàn)?;诤蠖瞬杉藘?yōu)勢,神策分析目前提供了 Java、PHP、Python、Ruby 等后端語言的 SDK,以及 LogAgent、BatchImporter、FormatImporter 等導入工具,支持在后端采集。

圖5:適合“前端全埋點”的企業(yè)需求與適合“后端代碼埋點”的企業(yè)需求
圖5:適合“前端全埋點”的企業(yè)需求與適合“后端代碼埋點”的企業(yè)需求

綜上所述:

  1. 數(shù)據(jù)驅動是第一生產力,數(shù)據(jù)采集非“大全細實”,數(shù)據(jù)驅動如“空中樓閣”;
  2. 大數(shù)據(jù)時代≠無埋點時代。“無埋點”頂多個是個“萬金油”,功能很多,應急抹一抹,想治病還是難;
  3. 沒有任何一種通用數(shù)據(jù)采集方式是適合所有企業(yè)業(yè)務訴求的。根據(jù)行業(yè)領先企業(yè)實踐來看,后端代碼埋點才是距精細化運營最近的數(shù)據(jù)采集方式;
  4. 不從行業(yè)特性、自身實際需求出發(fā)的數(shù)據(jù)采集方案,都將是無用功
消息來源:神策網(wǎng)絡科技(北京)有限公司
China-PRNewsire-300-300.png
全球TMT
微信公眾號“全球TMT”發(fā)布全球互聯(lián)網(wǎng)、科技、媒體、通訊企業(yè)的經營動態(tài)、財報信息、企業(yè)并購消息。掃描二維碼,立即訂閱!
collection