很多同學被嫌棄:做的資料分析,沒深度。到底啥是分析深度?怎麼才能做出深度?話不多說,直接上場景。
問題場景:某物流企業,負責管司機的排程中心,會給每個未上線司機標註原因,標註格式如下圖:備註:實際原因還有很多,這裡僅做舉例現領導要求:分析司機未上線情況。問:該怎麼分析?
思
考
30
秒
0、0級深度做法
3月6日,共1000司機,上線900,上線率90%● 3月7日,共1010司機,上線875,上線率87%● 3月8日,共1050司機,上線850,上線率83%上線率連續2天下降,建議搞高不上線的理由TOP3為:1、司機請假 35%2、累25%3、雙十二剛過 20%
╮(╯▽╰)╭
不點評了,大家自行吐槽。
1、1級深度做法
上線代表的是運力,不同線路運力需求不同,因此可以結合需求,解讀上線資料:● A線路本月訂單暴漲,但司機上線率在下降,需保障運力。● B線路本月訂單減少,司機上線率在下降,可調撥該批司機運力。● C線路為季節性需求,預計下個月就沒有了,關注該批司機運力分配。
點評:終於知道把上線情況和業務需求聯絡起來了。這樣能解讀出:司機上線/不上線,到底有啥意義。重點線路需要保障,零散線路釋放出運力要能調配開,這是基本常識。
同理,還可以對司機生命週期做分類,結合司機表現,解讀上線資料。
● 新手期司機:上線變差,是否意味著最近開發新司機質量下降
● 穩定期司機:上線變差,是否意味著平臺運作出問題,老司機流失
注意,以上這些計算,需要衍生指標,比如:
● 線路訂單量:最近一週內訂單數、貨運噸位
● 線路訂單變化:最近N周內訂單走勢
● 司機生命週期:從註冊到當前時長
● 司機行車裡程:最近一週行車裡程
● 司機缺勤頻率:最近一週無出車天數
這些資料不見得在一個表裡能體現,因此得從各個資料來源找資料組合分析。
這麼做看起來比0級有深度了不少,但沒有解決一個核心問題:“到底司機不上線是啥原因?“,特別是“請假”比例這麼高,到底是司機不想幹,還是沒需求,還是平臺出了問題。
2、2級深度做法
注意,1級深度的核心問題,在於:未上線原因給的亂七八糟。● 什麼叫:雙十二過了?● 什麼叫:累● 請假和累是不是有重疊● 到其他線?那他該在其他線上線啊!
可能有些物流企業管理較規範,但這家物流企業調動真的不咋樣。這種敷衍了事的回覆看了讓人摸不著頭腦,根本沒法用。
但是要如何規範起來呢?如果平地一聲雷,甩一套新模板出去,不但培訓需要時間,而且和現有的資料對不上,很有可能製造新的資料垃圾。因此更好的做法是,先基於現有分類,梳理出邏輯,再培訓,提升規範度。
分類就要用到MECE法,實現MECE的最好辦法是:二分類。從示例反饋來看,可以用三層分類邏輯。
▌ 第一層二分類邏輯,最好用:線路問題/個人問題來區分(如下圖)。
這樣分類含義很直觀:線路問題跟司機沒關係,有些中小客戶,就是季節性/臨時性有需求(比如雙十一、雙十二)需要企業這邊開發客戶/分配好線路。司機的問題,再做進一步細分。
▌ 第二層分類邏輯,可以拆是否車壞了。車壞了是鐵定沒法運的,此時不但要登記原因,還得登記車輛損壞情況或預計修好時間。如果車輛嚴重損壞,可能直接導致司機退出,或者長時間運力缺失,這個情況對於新運力開發很重要。至於司機個人問題,再做細分。
▌第三層分類邏輯,可以看司機是否投訴平臺。比如平臺扣錢太多,這是個規則問題。平臺方也不可能因為一個司機的抱怨就改規則。但是,對投訴類問題要先掌握情況。這樣才能持續監控,發現更深入的問題。至於沒有投訴情況下,司機個人問題,另行處理:
為啥司機個人問題要另行處理?因為個人問題很有可能沒實話。拉貨的司機不是辦公室文質彬彬的小白領,沒心情一句句細講心路歷程。一句:“累”背後,可能有多重含義:
● 個人心累,不想幹司機了
● 在你這幹得累,不想在你這當司機了
● 線路跑得累,不想幹這個線路的司機了
單純指望口頭問,很難理清楚這裡邏輯。更不要說大部人連個“累”都懶得說,就是簡簡單單的不接電話/“請個假”。排程員每天對著幾十個司機,也沒空一個個談心,也不太指望排程員能把個人原因都整明白。所以這裡可以簡單記錄原因,靠後續分析來做深。
綜合梳理完,現有歸類可以合併如下:
這樣能建立監控指標,觀察問題,也能加強對排程員的要求。並且排程員需要關注的核心問題只有三個:
1、有沒有線路調整
2、有沒有車輛問題
3、有沒有投訴
比起一次給30個選項的調查表,這樣抓關鍵行為的做法更容易讓排程員掌握,降低培訓成本,且後續資料也能和之前的對上,避免新資料垃圾產生。
然而,這樣做就夠深度了嘛?顯然沒有,這裡遺留了好幾個問題。
3、3級深度做法
有了2級深度的分類,3級深度的分析思路就非常清楚了:● 遺留問題1:線路到底是排程問題還是推廣問題● 遺留問題2:司機投訴到底要不要受理● 遺留問題3:司機缺勤到底是“累“還是”不想幹“
這三個議題,都需要專題深度分析來解決,已經不是單純靠報表監控能搞掂的了。
▌ 比如問題1:想區分呢排程問題還是推廣問題,得首先對線路端打標籤,做分類。
比如:
● 線路本身需求不穩定
● 線路本身需求大幅度下降
● 線路本身難開,司機流失多
這些並不反映在排程表裡,但是卻直接影響排程結果與司機上線,因此需要從線路需求表裡,先分析清楚,這樣解釋排程的原因才容易說。
▌ 比如問題2:司機投訴到底要不要受理,這裡可以分規模、內容、效果兩個角度來看。
● 規模:是否投訴量在加大,是否投訴集中在某些客戶,某些線路,某些時間段
● 內容:是否投訴集中在某些問題,特別是與薪資、扣款相關的
● 效果:是否投訴行為導致的影響在加劇,比如投訴後司機流失率在提升
這樣綜合分析,才方便運營評估:是否要響應投訴,看到投訴指標變化,也好理解這個指標對業務的影響程度。
▌ 比如問題3:司機到底是累還是不想幹,得先看內部資料說話透過內部資料,能看出司機實際行車時間,把“累“字背後含義:真的累or賺不到錢區分出來,從而針對性分析。這樣做比追著司機刨根問底,更容易發現問題(如下圖)。
理論上,這裡還有深入的空間,讀者們可以自行發揮哦。
4、小結
很長時間以來,人們把做資料分析的看成算命先生:我不說話,你丟幾個銅錢(敲幾下鍵盤)就天知地知。這是非常非常扯淡和錯誤的。
本質上看,資料分析對抗的是不確定性。因此需要大量的資訊輸入,才能得出結論。阻礙資料分析由淺入深的最大問題,也是:沒!數!據!
並且如同上邊小案例所示:過分追求完美資料,不但會拖慢業務,增加成本,而且對內部員工和外部客戶體驗都很差 — — 大家是來消費的,不是來被扒戶口本的。
所以,資料分析工作,始終伴隨著不完美的資料開展,在有限大的條件下,一步步匯出結論,才是由淺入深的方法(如下圖)。
這裡最重要的三個環節,就是:
1、結合業務含義,對描述統計初步解讀
2、結合業務問題,形成分析框架
3、結合業務策略,驗證判斷
文章來源:可樂的資料分析之路
※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※
我是「数据分析那些事」。常年分享数据分析干货,不定期分享好用的职场技能工具。各位也可以关注我的Facebook,按赞我的脸书并私讯「10」,送你十周入门数据分析电子书唷!期待你与我互动起来~