《一週數據埋點之旅》第五天:埋點注意事項

0x01 前言

前兩節我們介紹了埋點設計四大思維,並給出了四種典型場景的埋點設計方式,本節介紹在埋點設計中的注意事項,這些事項是在進行埋點設計的時候應該遵循的準則,通過本節的閱讀,你將獲得以下準則的認知:

·同質一致

·同質繼承

·通用複用

·粒度平衡

0x02 同質一致

相同指標度量的上報時機和格式一致,比如:

1.實體返回鍵和app返回鍵及空白位置的點擊clickid統一處理成return

2.頁面停留時長資訊的上報,其上報時機為離開頁面的時候,時長單位ms

3.多同質元素的曝光,用統一的上報格式,如下:

a=x,b=x,c=x;a=y,b=y,c=y #或者
a=x&b=x&c=x,a=y&b=y&c=y

曝光和點都採用列表的方式, 在統計該位置的點擊率的時候,若點擊事件的上報和曝光事件的上報格式一致,可極大的提高效率

同質參數的名稱和類型應該保持一致

同質參數的設計一致主要體現在普通參數、維度參數、行為標識上,雖然這些要求是數倉規範上介紹的,但如果能事先治理,在數據採集的時候就規範化,其能減輕的工作量是巨大的。以下是一些通用的詞根:

普通字段

行為字段規範

注意:命名規範的應該遵循相應的邏輯,先要理解現有的埋點規範,然後對其進行沿襲,最好設計之初就嚴格按規範來執行,可以有效的避免後面統一的時候需要考慮新舊相容的情況。

同頁面同模組的事件名基本一致

同一個頁面的點擊事件,應該從事件名上可以直接進行區分,如下:1、進入頁面即上報該頁面的pv,作為分母(下滑等操作曝光的頁面上部分的內容再單獨上報各自的show事件)2、頁面各個部分的點擊遵循:頁面名_模組部分名_click/show例如:

0x02 同質繼承

·跳轉繼承

從A頁面跳轉到B頁面,只在B頁面的展現事件上報了from,而在B頁面的後續重點操作都沒有繼承最初進入該頁的from屬性,或者在B頁面的下一級需要重點關注來源的頁面也漏報了from屬性,都是繼承中斷的情況。

·初始繼承

初始繼承是指在用=使用者當天(或者更長日期)首次發生某種行為的時候,該行為即成為用戶的一種標籤,在後續的其他事件的上報上都上報此標籤。比如記錄首次啟動的方式,桌面圖示的啟動的,則標注為圖示啟動用戶。雖然後臺的數據處理可以計算出用戶的這些首次行為標籤,但是多個行為的時候可能會存在計算量大的情況。

0x03 通用複用

該準則的要求是儘量少的創建新的事件,而是想法複用原來的事件,這不僅是減少事件數量,方便後續的埋點管理,同時在思考能否複用的過程中,也是對自己埋點設計的能力的一次檢驗,檢驗埋點設計的擴展性如何。此處以彈窗的曝光和點擊為例介紹

在此框架基礎上,任何彈窗類型的交互事件都可以用該框架進行上報,其差異可能只是其中某些參數值的區別。在《埋點設計(上)》仲介紹的適合抽象思維進行組織的事件,都適用於通用複用準則。但需要注意的是若參數層級的組合情況較多的時候,建議將參數的曾經用資訊表的方式組織。每個參數一列,而沒一行是一種參數組合情況。

0x04 粒度平衡

粒度平衡指埋點粒度在最小化的原子粒度和抽象粒度概括之間要平衡,常見的有以下幾個方面:

時間粒度

時間粒度在盒子不變,其交互也不變,而盒子裏的內容通過左右滑動或者點擊跳轉而改變,簡言之就是複用同一套範本的交互情況下要特別注意。此處以某詳情頁的停留時長粒度來舉例:事件名:離開詳情頁事件id: x_detail_exit 上報時機:

·點擊返回、切後臺等常規形式的退出

·點擊頁面交互元素跳轉非同類範本頁

·點擊相關推薦等進入同類範本頁

·參數: stay_duration:停留時長,單位ms 在設計埋點的時候,該事件的停留時長參數就一定要精確到原子粒度,即單個內容的停留時長,而不是該類頁面的停留時長。基於單個時長可以統計同類時長,若埋點粒度太粗,就沒法分解,這樣在計算類似TopN條目的情況,埋點數據就無法支撐了。

事件粒度

雖然我們在設計埋點的時候要求採集的資訊要完善,不能漏采,但並不是意味事件的上報並不是越多越好,要全但是不要濫,至於上報哪些事件,則要從整個產品交互邏輯和漏斗分析的重點對象出發,在滿足版本迭代功能需求統計基礎上,不斷補齊漏斗環節。

事件的串聯此外事件粒度也體現在埋點設計上,可以將一個串的事件用一個時間id,而在params裏使用attribute1這個參數來代表不同的階段,進行了埋點展平,同時這樣的拆分設計也可以避免在不同的階段下,附帶的參數不一致,而需要不斷的說明層級的關係。

時間粒度的上報數據量度量此外在處理類似心跳事件這樣可能造成大量數據上報的情況,要有事前的預估,如果可能超出數據的接收能力,則在客戶端進行選擇性的上報,但要注意上報樣本的均勻合理,能夠反映總體的特徵。

0x05 總結

本節從同質一致、同質繼承、通用複用、粒度平衡四個方面介紹了埋點的注意事項,嚴格遵循這些準則能很大程度上提高埋點設計的效率,保障埋點設計的品質。

數據科學系列文回顧:

十週入門數據分析系列文回顧:

關注數據君的臉書:

我是「數據分析那些事」。常年分享數據分析乾貨,不定期分享好用的職場技能工具。按贊我的臉書,會有豐富資料包贈送唷!

這是一個專注於數據分析職場的內容部落格,聚焦一批數據分析愛好者,在這裡,我會分享數據分析相關知識點推送、(工具/書籍)等推薦、職場心得、熱點資訊剖析以及資源大盤點,希望同樣熱愛數據的我們一同進步! 臉書會有更多互動喔:https://www.facebook.com/shujvfenxi/

這是一個專注於數據分析職場的內容部落格,聚焦一批數據分析愛好者,在這裡,我會分享數據分析相關知識點推送、(工具/書籍)等推薦、職場心得、熱點資訊剖析以及資源大盤點,希望同樣熱愛數據的我們一同進步! 臉書會有更多互動喔:https://www.facebook.com/shujvfenxi/