指標下降如何資料分析?從拿到問題到結果輸出,完整方案分享

作者:Cherich_sun
來源:公眾號「杰哥的IT之旅」ID:Jake_Internet

本篇文章是以一個案例的方式呈現一些資料分析相關知識。涉及詳細的分析思路及多種分析方法,如多維度拆解、假設檢驗、相關性分析、迴歸分析,適用問題場景是:如何把有限的資源投放到有效的地方才能發揮出最好的效果(比如商品價格和滿意度對新增使用者同時有影響,這時重點關注哪個)。

不經歷實戰的理論都是紙上談兵,話不多說,我們開始吧。

一、專案背景

公司發現汽車銷售額自一年前開始逐漸減少,想讓你幫忙找找汽車銷量下滑的原因,最好能提出一些解決方案。

二、利用資料分析解決問題的過程

明確問題、分析原因、提出建議

1、明確問題

首先要將問題定義清楚,這是資料分析的第一步。

需要注意的兩點:如果問題定義錯了,後面的分析毫無意義。比如:老闆告訴你:“可能是客單價高,最近利潤下降了”,聽到這番話,你將問題定位為“高客單價導致利潤下滑了,怎麼辦”,這樣錯誤的定義會縮小你的分析範圍,導致最終結果出現偏差;另外一種情況,分析者根據自己過往的經驗來定位問題,把思考限定在:“我覺得”,資料分析不是主觀的臆斷,而是一種客觀的分析

在案例中,問題的關鍵指標是 “銷售額”,銷售額下降了導致銷量下滑。

①驗證資料準確性

不要急於分析,首先要和相關人員確認”下滑”,並有資料佐證。要保證資料本身是準確的,才能進行後面的步驟。在本案例中,可與相關人員溝通,瞭解清楚”銷售額下滑”具體表現為哪些現象。

例如:透過分析業務資料,發現汽車銷售額在這兩年確實下降了15%左右。

目前要解決的問題是:銷售額逐漸下降的原因是什麼,怎麼解決?

②理解業務指標

對於業務指標,首先要確定分析指標的含義。
在這個案例中,用”銷售額”這個關鍵指標,銷售額這個指標是怎麼定義的?
透過和業務部門溝通,明確了指標的定義:
銷售額=銷售量 * 平均單價
銷售量=首次購買量 + 再次購買量
再次購買量=客戶忠誠度 * 再次購買人數

2、分析原因

影響銷售額下降的原因有很多,如果把所有原因都分析一遍,那麼這個工作量是非常大的。所以,在分析原因的過程中,要優先分析關鍵因素。

①多維度拆解分析法

是什麼?

多維度拆解分為維度(角度)和拆解,實質上是做加法。比如使用者下降了 = 新使用者數量 + 老使用者數量

有什麼用?

拆解整體資料內部各個部分的構成差異進行細分,將一個複雜的問題拆分成可以逐漸解決的子問題

怎麼用?

可以透過指標構成或者業務流程來拆解

對於本案例,我們是透過指標構成拆解,對問題進行拆解,將複雜問題細化成各個子問題。為了找到”哪裡出了問題”,可以對”銷售額”這個指標進行拆解。至於拆解到什麼程度,沒有統一的標準,要根據對業務的理解和實際問題靈活把握,本案例拆解如圖所示:

②假設檢驗分析法

是什麼?

假設檢驗實質上是邏輯推理,使用資料來做決策的過程

有什麼用?

可以分析出問題出現的原因,適用於歸因分析場景,比如:分析產品DAU下降原因是什麼?

怎麼用?

根據業務流程,提出假設 — — 收集證據 — — 得出結論,在業務中這三步是不斷重複的過程。不斷重複這個過程,直到找到問題的根源。

接下來使用假設檢驗分析方法對多維度拆解後的每個業務流程提出假設,並加以驗證。

提出假設:銷售數量或平均單價,影響銷售額下降?

得出結論:銷售數量與銷售總額一樣,也減少了近 15%。由此可見,我們應該優先關注銷售數量的資料,假設成立。

平均單價在 2 年期間比較穩定,基本在平均值(200 萬元)上下 5%(190 萬 ~ 210 萬元)的範圍內。至少在過去的一年裡,沒有出現過價格明顯上升的情況,所以假設不成立。

提出假設:首次或再次購買量下降,導致再次購買量下降?

得出結論:雖然兩者在數量上沒有太大差異,但首次購買量基本維持穩定,而再次購買量卻在過去一年出現了減少。因此,可以確定,再次購買量應該是新車銷售總額下滑的原因之一,假設成立。

提出假設:客戶忠誠度下降,導致再次購買量下降?

得出結論:可以發現導致“再次購買量”減少的是客戶忠誠度的下降所導致,假設成立。

至此,我們發現了導致銷售額下降的關鍵因素是受到再次購買量以及使用者忠誠度的影響。

分析到這兒,可能會有人覺得結束了!實際上並沒有,現在的分析結果無法產生實際的意義。僅僅看到使用者忠誠度下降還不能決定”接下來要採取哪些具體措施才能解決問題”。所以,接下來要分析為什麼客戶的忠誠度下降,有什麼改進措施

現在將忠誠度再進行拆解,並不斷提出假設,作出驗證。

提出假設:由於各差異產品的銷量|平均忠誠度,影響了再次購買量

得出結論:對銷量的構成比例進行比較,發現車型 A 的比例明顯小於其他車型,那麼如果將問題鎖定為車型 A,即使採取了有效的對策,對解決整體問題的影響仍然是有限的。因此可以暫且降低車型 A 的優先順序。

按照不同車型,對客戶忠誠度在 2 年期間的平均值進行比較,只有車型 A 的客戶忠誠度顯著偏低,其他車型之間沒有太大差別。

接下來,暫且將車型 A 從比較物件中剔除,對其餘 3 個車型進行比較忠誠度變化比較。

發現車型 B 車型 C 的客戶忠誠度從年前開始逐漸降低。可能選擇了競品公司。具體數字是 2 年期間從約 80%~90% 減至 50%~60%,降低了 30–40 個百分點。表明:產品B、產品C的客戶忠誠度出現了問題,假設成立。

提出假設: 由於競品公司推出新產品|綜合滿意度下降,影響了使用者忠誠度。

透過分析競品公司推新情況,發現並沒有新產品上市,假設不成立。但是,從客戶的綜合滿意度趨勢圖看出明顯下降了,那麼說明綜合滿意度影響了客戶忠誠度。

上面我們透過使用假設檢驗分析方法,首先分析出銷售額下降的原因是銷售數量,銷售數量下降的原因是再次購買量下降,再次購買量下降原因是產品B、產品C的忠誠度下降,忠誠度下降的原因是使用者綜合滿意度下降。

兩者是否具有相關性,如何來驗證兩種資料的相關性,可以透過相關分析法。如果相關,那麼忠誠度和綜合滿意度有多大程度上的相關,如何衡量。

③相關分析法

是什麼?

相關性分析是研究兩種或兩種以上的變數之間有什麼關係。如果變數間有關係,叫作有相關關係;如果沒有關係,叫作沒有相關關係。比如:學習時長和成績有相關關係。

有什麼用?

在研究變數間有什麼關係或者判斷某個事情是否受到其他事情影響時,不僅能幫助我們擴大思路,還能透過相關分析來衡量兩個變數因素的相關密切程度。比如判斷客戶忠誠度和客戶滿意度這兩個變數有多大程度的相關?

怎麼用?

如何衡量兩個變數的密切程度?透過”相關係數”,它就是專門用來衡量兩種變數的相關程度的,並且相關係數數值的正負可以反映兩種資料的相關方向,也就是說兩種變數在過程中是同方向變化還是反方向變化。

通常用字母 r 來表示 。可以用來快速鎖定問題。

相關係數 r 介於[-1,1] 之間,相關係數的絕對值|r | 越大,表明變數間的相關程度越強。

如果 r = 1,資料點都在一條直線上,表示兩個變數完全正相關(假設有a,b兩種變數),a的值越大,b的值也會越大;如果 r = -1,資料點都在一條直線上,表示兩個變數完全負相關,a的值越大,b的值反而會越小。

如果相關係數>0,說明兩個變數是正相關,是同方向變化,也就是一個變數的值越大,另一個變數的值就越大;

如果相關係數<0,說明兩個變數是負相關,是反方向變化,也就是一個變數的值越大,另一個變數的值反而越小;

如果相關係數=0,說明兩個變數是不相關(無線性相關),有可能是其它方式相關,比如曲線方式。

業務中,如何計算具體的相關係數?現在excel 、FineReport或 Python都有相應的功能或函式,我們只要知道怎麼用,懂內部原理就夠用了。圖下以Excel為例,以學習時長和成績為例,計算相關係數。流程如下:

下面計算本案例中綜合滿意度(月份平均)與客戶忠誠度的相關性係數,同樣利用Excel的資料分析功能。計算結果如下:

得出結論:整體客戶忠誠度與綜合滿意度之間的相關係數為 0.64,由此可知一般來說(不區分產品),兩者之間存在相關關係。再看不同產品的客戶忠誠度與綜合滿意度的相關性, B 和 C 與綜合滿意度的相關係數分別為 075、0.69,數值較高,可以確認為相關,假設成立。

再回到問題,只看綜合滿意度,還不能決定“應該釆取哪些措施”。這樣的話仍然無法對實際業務產生意義,所以接下來還要再次應用相關分析來探討“服務”、“產品”、“價格”不同維度與綜合滿意度之間的相關程度。定位產品B和C的綜合滿意度下降的根本原因是什麼。

分別對兩種產品的綜合滿意度和三種不同維度的相關性分析,結果如下:

對於B 來說,同類產品的價格比(相對而言是貴還是便宜)對綜合滿意度的影響較大。二者的相關係數為 -0.72,表示價格越高,顧客滿意度就會越低。需要注意其變化趨勢是相反的,也就是說, B 的使用者對價格比較敏感。對於C,售後滿意服務度對綜合滿意度的影響較大。二者相關係數為0.59,說明C的使用者比較在意售後服務體驗。

透過相關分析,發現跟銷售總額相關度最高的因素是使用者滿意度,尤其是產品B,優先調整同類產品價格比;產品C提升售後服務水平,可以顯著提升整體銷售額。

現在覆盤一下這個案例是如何分析的。分析流程如下:

3、提出建議

前面我們根據多維度拆解、假設檢驗、相關分析方法最終定位到銷量下滑的根本原因。接下來也就是根據找到的原因提出建議。那麼在提出建議這一步經常用的分析方法之一是迴歸分析。比如本案例知道需要提升滿意度,但是將滿意度具體改善到什麼程度,才能提升銷售額。這時候就需要用迴歸分析來計算出某個原因能夠對目標造成多大程度的影響。

迴歸分析

迴歸分析是確定兩種或兩種以上變數間相互依賴的定量關係的一種統計分析方法。

銷售案例:利潤和銷售的相關係數是0.99,說明兩個變數之間存在高度正相關。現在想知道下半年銷售額達到多少以後,就可以實現利潤5000萬元。要想預測,就要在散點圖上畫一條直線,穿過這些點,使這條直線儘量靠近各個資料點,這樣的直線叫作最佳擬合線。前提是兩種資料存在相關關係,那麼就可以保證每個點合理的接近直線,這樣就可以透過銷售額預測出利潤的值。

操作步驟如下:

①點選【資料】 — — 【資料分析】 — — 選擇【迴歸】 — — 【確定】 — — 勾選Y 和 X 的值 — — 選中【線性擬合圖】

②上面操作會得到下圖,點選【+】 — — 選中【趨勢線】 — — 點選右邊【三角】 — — 【更多選項】 — — 勾選【顯示公式】 — — 完成

這個方程可以理解為:Y(利潤) = 0.1445X(銷售額)-31.938。前面說過期望的利潤目標是5000萬,也就是利潤Y = 5000萬,代入迴歸方程就可以算出具體銷售額= 34,823.41萬元。也就是說,根據公司下半年想要實現5000萬的目標,我們需要將銷售額達到34823.41萬元。

以上就是使用迴歸分析的整體流程。簡單回顧下回歸分析:迴歸方程裡面有一種自變數的,這種迴歸叫一元線性迴歸;那麼使用線性迴歸的前提是兩個變數(因變數和自變數)要有相關關係,這樣才能使用一元線性迴歸;線性迴歸實質上在幫助我們解決資源合理分配的問題。比如銷售案例,知道了Y值,想知道X的值是多少。還有另外一種情況就是咱們的汽車銷售額下滑的案例,例如Y是綜合滿意度,X是售後滿意度,這樣我們就知道售後滿意度達到多少分時,綜合滿意度才能提升。當決策者有多種方案要選擇的時候,就可以根據迴歸分析,知道把有限的資源投入到哪裡才能發揮出最好的效果。

回到案例中:繼續解決產品B 的價格滿意度提升到多少;產品C的售後滿意度提升到多少,才能提高綜合滿意度,進一步提升客戶忠誠度。首先制定業務目標,也就是迴歸方程的Y值。那麼我們可以追溯到客戶忠誠度,會發現客戶忠誠度75%才是一個正常趨勢,所以我們確定過了要將產品B 和 C 的忠誠度提升到 75%。

透過迴歸方程,得出產品B 要想達到忠誠度到75%的目標,必須將綜合滿意度達到75以上。

接下來提升B產品客戶忠誠度:綜合滿意度與同類產品價格比的關係

最後提升C產品客戶忠誠度:客戶忠誠度與售後服務滿意度的關係

如何提高售後服務滿意度?

到這裡,分析結束。透過迴歸分析,最終得出可落地的建議如下:

影響銷售額下滑的主要定位到B產品的同類價格比 、C 產品的售後滿意度出現問題

1)產品B :價格波動不要高於同類產品 2%

2)產品C :要重點抓售後服務,尤其是服務態度要達到76分

三、總結

以上是本次透過汽車銷量下滑案例,對映一個完整的在工作中利用資料分析解決問題的過程。

首先,明確問題,透過觀察現象,將問題定義清楚。只有明確了問題,最後的分析才有意義。其次,分析原因,可以從兩個思路出發分別是哪裡出了問題?為什麼會出現這個問題?接下來使用【多維度拆解分析方法】,對問題進行拆解,將一個複雜問題拆解成多個子問題;

對拆解的各個部分,使用【假設檢驗分析方法】找到哪裡出現問題,在分析的過程中,可以結合其它分析方法輔助完成,比如透過相關分析法進行深入分析。最後,提出建議。找到原因不是分析的重點,而是要針對原因,給出建議或提出解決方案,並且具有落地性。

這裡常用的分析方法是線性迴歸,使用線性迴歸的前提是變數間具有相關性。只有這樣決策者才能夠根據具體的措施,合理分配資源,解決業務問題進而實現業務目標。

作者:Cherich_sun
來源:公眾號「杰哥的IT之旅」ID:Jake_Internet

這是一個專注於數據分析職場的內容部落格,聚焦一批數據分析愛好者,在這裡,我會分享數據分析相關知識點推送、(工具/書籍)等推薦、職場心得、熱點資訊剖析以及資源大盤點,希望同樣熱愛數據的我們一同進步! 臉書會有更多互動喔:https://www.facebook.com/shujvfenxi/

這是一個專注於數據分析職場的內容部落格,聚焦一批數據分析愛好者,在這裡,我會分享數據分析相關知識點推送、(工具/書籍)等推薦、職場心得、熱點資訊剖析以及資源大盤點,希望同樣熱愛數據的我們一同進步! 臉書會有更多互動喔:https://www.facebook.com/shujvfenxi/