數據分析沒思路?這些數據分析方法你已經掌握了麼?

數據分析那些事
12 min readOct 28, 2024

--

(以下文章來源於數據分析星球 ,作者數據分析星球)

00 前言

對於產品經理來說,產品的每一次迭代和升級,都需要評估效果,以便今後改進。如果僅僅是憑藉肉眼觀察和主觀感受,下一個“使用者反饋很好”、“使用者很喜歡這個新功能”類似的結論,是很蒼白無力的。更多時候,會因為主觀感覺而產生誤判,另外,數據分析還可以幫助產品經理更好地瞭解使用者,洞察使用者的需求。

而對於營運而言,作為與使用者和產品接觸最頻繁的人,也是策略的制定者和實施者,但產品營運的好與壞,最直觀的體現就是數據,透過數據的高和低作為衡量的一個標準。對於營運來說,數據產生和決策制定中間,一定還有大量可以最佳化的空間,這種空間很大程度上可來源於數據。從數據中發現知識,最佳化決策,將會成為大大提升營運效率。

所以,無論是產品還是營運,在數據驅動業務的大背景下,數據分析都是必須要掌握的一項技能,本文介紹了7種常用的數據分析方法,介紹了一個完整的數據分析過程中可能用到的系列方法:從界定問題→診斷現狀→定位問題環節→追溯問題原因→判斷問題發展趨勢。

01 整體思考框架:5W2H

5W2H:What(何事) When(何時) Where(何地) Who(何人) Why(何故) How(何法) How much(何幾),是對目標計劃進行分解和決策的思維框架,它對要解決的問題進行完整的刻畫,以便清晰地界定問題並找到解決方案。

1.What:何事?發生了什麼?一般用來指的是問題是什麼?是否真的發生了?比如DAU真的下降了嗎?;

2.When:何時?在什麼時候發生的? 問題發生的時間,比如DAU下降了,下降的具體時間是什麼?是不是節假日等等;

3.Where:何地?在哪裡發生的? 問題發生的拆解其中一個環節, DAU下降了, 是哪一個的地區的下降了,哪個終端的使用者下降了?還是哪一個功能的使用的人下降了等等;

4.Who:何人? 比如DAU下降了, 是哪一部分的使用者群體在降,是什麼年齡、性別、活躍度的使用者等等;

5.Why:何故?為什麼會這樣?問題發生的原因猜想,比如android使用者的DAU降低了,其他終端的DAU沒有降低,是不是android新發版本存在bug;

6.How:何法?明確上面的問題後,我們要採取什麼樣的方法和策略去解決DAU下降的問題;

7.How Much:何幾?做到什麼程度?DAU下降了以後, 我們對應策略的成本是多少,以及我們要把這個問題解決到什麼程度才可以;

5W2H分析方法從問題出發,有一套科學完整的分析思路,對造成問題的原因進行推測,並提出相應的解決方案,最終解決問題,形成閉環。

當然,5W2H只是一種思維方式,在實際應用過程當中可能還會遇到各種各樣的業務場景,針對不同的業務場景,整體的思路是一樣的, 但分析的維度就需要根據不同的產品形態和業務特性來調整。

02 描述問題現狀:對比分析

透過5W2H已經有了整體的思維框架,形成了大致的分析思路,接下來就要針對問題進行具體分析,首先從問題現狀入手。

沒有對比,就沒有最佳化提升的方向。在數據分析中,沒有對比,就沒有結論。

常見的對比思維有以下 5 種:

(1)跟目標對比:本月目標銷售額500w,實際完成了300w,目標達成率60%;

(2)跟上個月比:上個月銷售額200w,環比增長50%;

(3)跟去年同比:去年同期銷售額400w,同比下降25%;

(4)分渠道對比:線上/線下渠道銷售分別200w、100w;

(5)跟同類競對比:同水平競對A、B、C本月銷售額分別為600w、500w、100w;

總結一下上面的對比思維,主要是橫向和縱向對比:

橫向對比:同一時期,外部和競對比,內部各渠道對比

● 同一時期和外部競對對比,整體市場表現以及所佔市場份額變化;

● 同一時期自己內部各渠道對比,看銷售額貢獻和貢獻佔比變化;

縱向對比:自身不同時期對比

● 和上一期數據對比,近期有無提升/後退;

● 和去年同期對比,季節週期性考量下對比,是否有提升/後退;

數據分析的過程,就是在明確目標之後,透過對比等思維,找到問題的原因,得出分析的結論,提出可行的建議,從而起到幫助決策和指導行動的作用。

03 定位問題環節:漏斗分析

已經透過橫向、縱向對比大致瞭解了業務的現狀,知道業務是在變好/變壞,以及變好/變壞的程度,如果業務在持續變壞,我們就需要透過漏斗分析來定位問題到底出現在哪個環節上。

漏斗模型,本質是分解和量化,這裡以電商購物漏斗模型舉例。

也就是把購物的整個流程拆解成從選購商品到最終轉化成購買的一個個子環節,用相鄰環節的轉化率/流失率來量化每一個環節的表現。所以整個漏斗模型就是先將整個購買流程拆分成一個個步驟,然後用轉化率/流失率來衡量每一個步驟的表現,最後透過異常的數據指標找出有問題的環節,從而解決問題,最佳化該步驟,最終達到提升整體購買轉化率的目的,整體漏斗模型的核心思想其實可以歸為分解和量化。

漏斗分析其實是一種業務流程拆解和量化的思路,任何業務流程都可以按照這個思路來拆解,常見的業務漏斗模型還有很多:消費者行為AIDMA漏斗、使用者生命週期的AARRR漏斗等。

04 細分分析原因:細分拆解

透過漏斗分析我們大致可以定位到問題出現在哪個環節,但是,到底是什麼這個環節的哪個部分出了問題,我們還需要進一步細分拆解定位問題癥結所在。

在數據分析中,細分是數據分析的靈魂,沒有細分拆解,就沒有數據分析。

常見的細分方法有以下 5 種:例如本季度的銷售額沒有達標,可以按照以下思路進行細分:

(1)按時間細分:哪個時間段的銷售額出了問題?

(2)按空間細分:哪個區域的銷售額出了問題?

(3)按過程細分:售前導購、購買體驗還是售後服務的哪個過程出了問題?

(4)按公式細分:GMV=流量*轉化率*客單價,流量、轉化率和客單價的哪個部分出了問題?

(5)按模型細分:使用者價值分層模型,不同價值的使用者的銷售額貢獻,是哪類使用者出了問題?

拆解的方式千千萬,在運用細分拆解思維的過程中,要做到有的放矢,圍繞數據分析的目標,找到合適的拆解方法,否則只能無頭蒼蠅一樣到處亂撞。

另外,當發現數據異常時,嘗試從不同的維度進行細分,這樣既能鍛鍊數據分析思維,又能加深對業務的理解。

05 尋找相關因素:相關性分析

如果一個變數改變的時候,另一個變數也朝著相同的方向發生變化,那麼我們就說這兩個變數之間存在相關性。

相關性分析,就是尋找變數之間相互關聯的程度,相關性一般透過相關係數衡量。最常用的是用於計算線性相關係數的Pearson相關係數,取值區間在1到-1之間。1表示兩個變數完全線性相關,-1表示兩個變數完全負相關,0表示兩個變數不相關。數據越趨近於0表示相關關係越弱。

用Excel進行簡單的相關分析,通常包括以下 3 個步驟:

(1)收集相關數據

(2)繪製散點圖形

(3)計算相關係數

需要注意的是,相關性不等於因果性。兩個變數之間相關性,並不代表其中一個變數的改變,是由另一個變數的變化導致的。

比如說,分析發現,國家的諾貝爾獎數量,與巧克力消費量之間呈現正相關關係,但這並不是說,多吃巧克力有助於獲得更多的諾貝爾獎。一種合理的解釋是,諾貝爾獎的數量與巧克力的消費量,很可能都是由其他變數導致的,例如國民的受教育程度和富裕程度。

06 溯源影響因素:歸因分析

實際業務中,很多問題的出現並非是單個因素造成的,而是經過多種因素的影響而共同造成的。

所以數據分析最頭疼的問題就是:導致問題的原因到底是什麼?歸因分析(Attribution Analysis)要解決的問題就是多因素影響的情況下,最終效果的提升/下降,應該如何合理地分配給過程中的各個因素。

現實情況往往是很複雜的,在衡量其貢獻價值時,只依靠單渠道歸因分析得到的結果是不科學的,需要引入多渠道歸因分析。常見的多渠道歸因分析模型如下:

1、末次歸因模型:將功勞100%分配給成交前的最後一個環節

2、首次歸因模型:將功勞100%分配給第一個環節

3、線性歸因模型:將功勞平均分配給過程中的每個環節

4、時間衰減歸因模型:距離最終結果時間越短的環節,可以獲得越多的權重

5、位置歸因模型:第一次和最後一次環節各貢獻40%,中間的所有環節平分剩下的20%貢獻

6、自定義模型:根據自身業務的需求,自定義各環節分配比例

沒有完美的歸因分析模型,任何模型都存在它的侷限性和不足,如何有效地結合使用場景和模型特點是用好歸因模型的前提。

07 預測變化趨勢:預測分析

瞭解完問題的現狀,定位到問題的原因後,我們還需要預測問題接下來的發展趨勢。

另一方面,在各行業各領域,只要有核心的業務指標,都要預測核心業績未來的走勢,銷售,市場行銷,營運,財務等,一方面可以對未來的發展趨勢有個大致的掌握,另一方面也可以提前規劃,設定各子部門的KPI,以便儘可能地完成或者超過KPI,所以,如何準確地預測核心指標的變化趨勢非常重要。

什麼是預測?用最簡單的術語來說,它是在分析過去和現在的數據,進而預測未來的過程。我們主要根據時間序列數據進行定量預測。我們透過一個案例說明時間序列數據的主要組成。

如下是各年搭乘飛機飛行乘客數量的趨勢。

1.趨勢性:趨勢是事物發展或變化的總體方向。在上面的例子中,我們看到時間序列呈增長趨勢,這意味著在搭乘飛機飛行的乘客數量整體趨勢上是在增加。如下圖中第一張圖所示。

2.季節性:在上述時間序列中可以看到的另一個清晰的模式,就是該變化趨勢以固定的時間週期重複,我們稱為季節性。在特定時間週期內重複出現或重複的時間序列中任何可預測的變化模式都可以說是季節性。下圖中第二張圖所示。

3.隨機性:去除趨勢性和季節性後,剩下的就是一些隨機的、無任何規律的白噪聲。下圖中第三張圖所示。

時間序列預測的模型有很多,主要歸為以下2類:

1、傳統預測方法

AR(Auto Regressive Model)自迴歸模型

MA(Moving Average Model)移動平均模型

ARMA(Auto Regressive and Moving Average Model)自迴歸移動平均模型

ARIMA(Auto Regressive Integrate Moving Average Model)整合移動平均自迴歸模型等

2、現代預測方法

基於機器學習方法、深度學習的預測方法。對於機器學習方法,xgboost,隨機森林及SVM這些都是可以用的,也沒有說哪個模型好用,需要看具體的場景及實驗,總之就是看效果說話。

3、用Excel也能做預測

不需要複雜的演算法和模型,用Excel也能做簡單的預測。

以上就是本期的內容分享~~,碼字不易,如果覺得對你有一點點幫助,歡迎「追蹤」,「按贊」,「分享」喔,我會持續為大家創作優質的內容~~

※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※

我是「數據分析那些事」。常年分享數據分析乾貨,不定期分享好用的職場技能工具。各位也可以關注我的Facebook,按讚我的臉書並私訊「10」,送你十週入門數據分析電子書唷!期待你與我互動起來~

☞☞☞點選下方圖片免費體驗FineBI工具demo

文章推薦:

數據分析之落地 sop 流程

那些年,背過的SQL題

MySQL常用指令碼

商業分析應該怎麼做?一篇文章把思維和工具說清楚了!

乾貨 | 如何搭建用戶分析體系

回顧十週入門數據分析系列文:

關注數據君的臉書,ins(全網同名)

我是「數據分析那些事」。常年在臉書ins分享數據分析乾貨,不定期分享好用的職場技能工具。按贊我的臉書,並在臉書置頂帖子下回復SQL50,會有MySQL經典50題及答案贈送唷!

--

--

數據分析那些事
數據分析那些事

Written by 數據分析那些事

這是一個專注於數據分析職場的內容部落格,聚焦一批數據分析愛好者,在這裡,我會分享數據分析相關知識點推送、(工具/書籍)等推薦、職場心得、熱點資訊剖析以及資源大盤點,希望同樣熱愛數據的我們一同進步! 臉書會有更多互動喔:https://www.facebook.com/shujvfenxi/

No responses yet