寫給資料分析新人:一種通用的資料思維

此文是《10周入門資料分析》系列的第22篇

想瞭解學習路線,可以先閱讀 學習計畫 | 10周入門資料分析

「Why-What-How」在講解概念和執行上是個不錯的思維模型,本文依例按此框架來拆分數據分析。很多新人可能還沒有資料分析的思路,這裡權且從個人的角度進行梳理,以供參考。

一、WHY:為什麼要做資料分析

個人的理解, 資料分析是為了能以量化的方式來分析業務問題並得出結論,其中有兩個重點詞語:量化和業務。

量化是為了統一認知,並且確保路徑可回溯,可複製。除「量化」之外,另外一個重點詞語是「業務」。只有解決業務問題分析才能創造價值,價值包括個人價值和公司價值。

那麼,如何站在業務方的角度思考問題呢,總結起來就是八個字「憂其所慮,給其所欲」:

  • 溝通充分
  • 結論簡明
  • 提供資訊量及可落地建議
  • 尋求回饋

在溝通上,確定業務方想要分析什麼,提出更合理專業的衡量和分析方式,同時做好節點同步,切忌一條路走到黑。舉例來講,業務方說要看頁面停留時長,但他實際想要的,可能是想衡量使用者品質,那麼留存率、目標轉化率才是更合適的指標。

在闡述分析結果上,要記得結論先行,逐層講解,再提供論據。因為業務方或管理層時間都是有限的,洋洋灑灑一大篇郵件,未看先暈,誰都沒心思看你到底分析了啥。

在提供資訊量及可落地建議上,先要明白什麼叫資訊量:提供了對方不知道的資訊。太陽明天從東方升起不算資訊量,從西方升起才是。

二、WHAT:什麼是資料分析

資料分析的本質是抓住變與不變。「變」是資料分析的基礎,如果一個業務每天訂單是 10000 單,或者每天都是以 10% 的速度穩步增長,那就沒有分析的必要了。而若想抓住變,得先形成“不變”的意識。

因此,我建議新手要形成習慣,每天上班第一時間查看資料:即時&日周月報;記錄關鍵資料(榜單&報告)

在「不變」的基礎上,便能逐漸培養出指標敏感性,即意識指標偏離的能力。這主要是透過各種日環比,周月同比的監控以及日常的好奇心來保持。我們從一個 Questmobile 榜單上,來簡單看下「指標偏離」是怎麼應用到日常的分析上的:

Image for post
Image for post

這裡先跟大家分享下怎麼看這種榜單:

  • 看整體排行:看哪些 APP 排在前方是出乎你意料之外的
  • 分行業看排行:看行業裡排行及其變動
  • 看增長率:哪些 APP 增長比較快
  • 看使用時長等其他指標

資料分析的定義,還有國外一本商務分析的書籍的定義作為注腳:

Image for post
Image for post

三、HOW:怎麼進行資料分析

任何資料分析都是「細分,對比,溯源」這三種行為的不斷交叉。最常見的細分對比維度是時間,我們透過時間進行周月同比,發現資料異常後,再進行維度或流程上的細分,一步步拆解找到問題所在。

1、細分

在細分方式上,主要有以下三種方式

  • 橫切:根據某個維度對指標進行切分及交叉分析
  • 縱切:以時間變化為軸,切分指標上下游
  • 內切:根據某個模型從目標內部進行劃分
Image for post
Image for post

橫切

橫切上,我們對維度和指標做做了分類和交叉,當某一類的指標出現問題時,我們便知道該從什麼維度進行分析。在進行橫切分析時,經常需要多個維度交叉著使用。

縱切

縱切上,有目的有路徑,則用漏斗分析。無目的有路徑,則用軌跡分析。無目的無路徑,則用日誌分析。

Image for post
Image for post

內切

內切上,主要是根據現有市面上常見的分析模型,RFM,Cohort 和 Segment等方式進行分析。RFM 即最近購買時間,頻率及金額三個指標綜合來判定用戶忠誠度及粘性。

Image for post
Image for post

2、對比

對比主要分為以下幾種:

  • 橫切對比:根據細分中的橫切維度進行對比,如城市和品類
  • 縱切對比:與細分中的縱切維護進行對比,如漏斗不同階段的轉化率
  • 目標對比:常見於目標管理,如完成率等
  • 時間對比:日環比,周月同比;7天滑動平均值對比,7天內極值對比

3、溯源

經過反復的細分對比後,基本可以確認問題所在了。這時候就需要和業務方確認是否因為某些業務動作導致的資料異常,包括新版本上線,或者活動策略優化等等。

如果仍然沒有頭緒,那麼只能從最細顆粒度查起了,如使用者日誌分析、使用者訪談、外在環境瞭解,如外部活動,政策經濟條件變化等等

4 、衍生模型

在「細分對比」的基礎上,可以衍生出來很多模型。這些模型的意義是能夠幫你快速判斷一個事情的關鍵要素,並做到不重不漏。這裡列舉幾個以供參考:

  • Why-How-What
  • 5W1H
  • 5Why
  • 4P模型(產品,價格,管道,宣傳)
  • SWOT 模型(優勢,劣勢,機會,威脅)
  • PEST 模型(政治,經濟,社會,科技)
  • 波士頓矩陣

四、How:資料分析如何落地

以上講的都偏「道術技」中的「術」部分,下面則通過匯總以上內容,和實際工作進行結合,落地成「技」部分。

1、資料分析流程和場景

根據不同的流程和場景,會有些不同的注意點和「術」的結合

Image for post
Image for post

1.衡量-業務發展,產品效果

2.監控-數據異常

3.尋因-找到數據變化的原因

4.論證-產品上線是否有效,新策略能否上線,是否起了作用

5.探索-優化方案,專題報告,增長黑客

6.預測-預測銷量,製定目標

2、資料分析常見謬誤

控制變數謬誤

在做 A/B 測試時沒有控制好變數,導致測試結果不能反映實驗結果。或者在進行資料對比時,兩個指標沒有可比性。

樣本謬誤

在做抽樣分析時,選取的樣本不夠隨機或不夠有代表性。舉例來講,互聯網圈的人會發現身邊的人幾乎不用「今日頭條」,為什麼這 APP 還能有這麼大流覽量?

定義謬誤

在看某些報告或者公開資料時,經常會有人魚目混珠。「網站訪問量過億」,是指的訪問使用者數還是訪問頁面數?

比率謬誤

比率型或比例型的指標出現的謬誤以至於可以單獨拎出來將。一個是每次談論此類型指標時,都需要明確分子和分母是什麼。

因果相關謬誤

會誤把相關當因果,忽略仲介變數。比如,有人發現雪糕的銷量和河溪溺死的兒童數量呈明顯相關,就下令削減雪糕銷量。其實可能只是因為這兩者都是發生在天氣炎熱的夏天。

辛普森悖論

簡單來說,就是在兩個相差較多的分組資料相加時,在分組比較中都佔優勢的一方,會在總評中反而是失勢的一方。

Image for post
Image for post

總結

資料準確性是第一位的,站在業務方的角度思考問題:憂其所慮,予其所欲,定義「變」與「不變」,細分,對比,溯源。

>>>

我是「數據分析那些事」。常年分享數據分析乾貨,不定期分享好用的職場技能工具。follow我的臉書,期待你與我的互動!

系列文回顧:

學習計劃|帶你10周入門資料分析

4招教你煉就資料分析的思維

數據分析慣用的5種思維方法

資料分析必備的43个Excel函式,史上最全!

實操:如何用Excel做一次完整的資料分析

寫給新人的資料庫入門指南

零基礎快速自學SQL,2天足矣!

資料視覺化技能的進階路線:SQL+BI+Echarts

數據分析必掌握的統計學知識!

不可不知描述性統計

資料分析必備的統計學(二):假設檢驗

一次讓人臉紅心跳的python數據分析

Python入門(一)環境&資料結構

Python入門(二)函數基礎

Python資料分析(三)NumPy

Python資料分析(四)Pandas

Python資料分析(五)Matplotlib做視覺化

推薦!42款好用的資料視覺化工具盤點

分享一些資料分析常用的資料視覺化圖表

【新人入門篇】資料視覺化分析不是個事兒

數據分析工具怎麽選?送你一個工具箱

Written by

這是一個專注於數據分析職場的內容部落格,聚焦一批數據分析愛好者,在這裡,我會分享數據分析相關知識點推送、(工具/書籍)等推薦、職場心得、熱點資訊剖析以及資源大盤點,希望同樣熱愛數據的我們一同進步! 臉書會有更多互動喔:https://www.facebook.com/shujvfenxi/

Get the Medium app

A button that says 'Download on the App Store', and if clicked it will lead you to the iOS App store
A button that says 'Get it on, Google Play', and if clicked it will lead you to the Google Play store