巧用工具,快速入門資料分析?

此文是《10周入門資料分析》系列的第23篇

想瞭解學習路線,可以先閱讀 學習計畫 | 10周入門資料分析

一提到資料分析,很多人可能腦海中可能會浮現出各式各樣的資料畫面。

比如下圖所示,這樣的報表在企業中經常被使用,精密的複雜表格樣式中蘊含著龐大的資料資訊量。

From PowerBI

還有常用的資料Dashboard視覺化,通常應用於展示KPI業務指標,例如銷售額、毛利率、利潤率等等,資料的視覺化呈現形式清晰直觀。

再就是目前比較火熱的視覺化戰情室,除了清晰直觀地展示企業核心的KPI指標之外,有點酷炫是它至關重要的特徵XD。

大道至簡的資料分析方法

但無論是以上的哪一種,無論資料如何變換,所有看似神秘的資料分析過程都可以歸納總結為各種「維度+度量」的組合分析。

維度用於描述事物的屬性資訊,例如統計各個地區的交易數量時,地區就是維度。

度量(指標)是可以量化統計的數值,例如統計各個地區的交易數量時,交易數量就是度量。但是需要注意的是並不一定所有的數值都是度量,例如學生的學號雖然是數數值型別,但是其實它是維度而非度量。

如此一來,我們對資料分析有了從整體上的解釋。但是實際應用中,我們並非盲目地去進行各種維度和度量的拼湊組合,而是希望得出的資料分析結果能夠指引業務進行決策,終而形成業務閉環效果的。

根據我自身的一些資料分析專案經驗,90%以上的基本資料分析問題都可以套用我總結的這七步完成(深入的資料分析需涉及描述性統計分析、相關性分析等專業的統計分析技能):

資料分析必然需要借助工具,Excel、BI或者R和Python語言都可以説明實現。

這裡為了幫大家更快速地理解資料清洗建模和資料差異分析環節的內容,借助比較簡單的BI工具FineReport,為大家進行一個銷售資料分析實例,加深大家對資料建模和資料分析過程的理解。感興趣的可以到官網下載,個人免費,但只有簡體版的喔。

一、確定資料分析目標

這是分析前的第一步,我們需要明確進行資料分析的物件,也就是需要確定分析目標。

通常來說我們會選取最關心的核心KPI指標,例如電商行業的銷量、銷售額、利潤,製造行業的次品率,互聯網行業的用戶留存率等等。

一般來說,分析目標不要過多,如果實在是需要同時分析多個關鍵核心業務KPI指標,那麼我們便可以將這些核心指標分解給對應業務負責人,例如銷售總監負責提升公司銷售業績,運營總監負責降低成本花費。

二、資料分析核心目標拆解

確定好分析目標之後,通常來說我們需要再對核心目標進行子目標分解,這也符合企業各團隊分工協作的特性。

資料分析核心目標拆解的過程中需要遵循MECE原則,也就是【完全窮舉,相互獨立】。例如下圖所示的電子商務數據運營指標體系,就分別從網站流量指標、轉化指標、用戶指標、商品類指標、風險控管指標幾個方面進行了詳盡的拆解,然後交由各個團隊進行分工達成。

圖片來自:Yolanda Chiu 文《2019 電商 PM 都應了解的 5 大數據運營指標 -【數據乾貨大全】》

三、資料分析前的資料清洗和業務建模

確立和分解好資料分析目標之後,下一步就可以進入到資料清洗和業務建模環節了。

資料清洗方面,很多人可能會想到國外傳統的一些ETL工具,但是這類工具過於龐大和複雜,FineReport支持連結多種資料庫,只需要寫幾句sql就能調用資料。

業務建模方面,可以根據不同業務主題分類建立業務包,一般來說按照維度表和事實表建立好關聯關係即可,這樣一來就為前端的資料差異分析準備好了資料模型。

四、資料差異分析

終於到了資料差異分析這一步,這也是離發現問題原因和業務決策最近的一步。

所謂資料差異分析,自然是需要有差異,才能有分析。

例如今年某某企業7月份的銷售額是600萬,那麼大家會覺得對於這個企業來說是好還是壞?如果只有這一個資料,自然是無所謂資料差異分析的。

如果這家企業的6月份的歷史銷售額是400萬,那麼7月份600萬的銷售額自然是非常好的了,可是如果這家企業的6月份歷史銷售額是800萬,7月份600萬的銷售額明顯是有問題的。

a.縱向對比

按照這個基礎的資料差異分析邏輯,我們借助FineReport來初步分析一下某家企業今年各月度的銷售額統計走勢圖:

如上圖所示,通過縱向對比不難看出該企業在7月份銷售額下降嚴重,環比6月份的企業銷售額下降了22.47%,不是個好現象。老闆看到這個資料自然會前來問責,說為什麼7月份公司銷售業績下滑這麼厲害。那麼會是什麼原因導致企業7月的銷售業績相對6月下滑這麼多呢?我們需要更新一步地進行資料分析,以排查出導致產生問題的「真凶」。

b.橫向對比

一般來說銷售型企業都會在全國劃分各個銷售區域,那麼這樣一來我們除了對時間進行縱向對比之外,還可以結合銷售大區維度進行橫向比較,分析探索看看能不能發現一些問題。

果不其然,如上圖所示,透過時間維度結合銷售大區進行橫向對比發現,企業的東南大區7月份的銷售額相對6月份反而是增長的,看來問題主要出在北方區和中西區,特別是北方區7月份的銷售業績下滑更為嚴重,最終導致企業7月份總的銷售額比6月份嚴重下滑。

資料分析的豐富度一定程度上依賴於分析工具的功能,比如Excel可能需要寫VBA,R和Python需要寫程式碼。

由於FineReport是一款商業智慧工具,所以可以依靠聯動分析功能更進一步的觀察各個區域7月份的表現情況,直接點擊圓形圖區域即可聯動到月度銷售額統計,非常方便。這邊我們可以看出,中西區7月份銷售額環比輕微下降17.86%,北方區下降嚴重到50.07%,而東南區則提高了6.06%,綜合三個大區的總體銷售狀況,導致最終表現為7月份銷售額環比下降了22.47%。

c.綜合對比

上面分析了時間、區域維度相關的銷售額結果統計,為了避免結論片面,我們儘量採用多維度的綜合對比方式來觀察資料,甚至可以是友商的銷售情況對比進行差異分析(此處不單獨舉例說明)。

如上圖所示,我們透過時間維度結合產品類型來進行銷售額分析,觀察7月份各個產品線的資料發現各個產品線在7月份銷售額環比都是有所下降的,這說明企業7月份銷售額下降和產品種類本身是沒有關係的。

五、通過資料分析發現問題原因

綜合北方區域和中西區域導致7月份銷售額環比下降的各種影響因素,最終發現是由於6、7月份北方區域降雨嚴重,導致物流周轉嚴重滯後,庫存商品無法及時供應,最終導致北方區域7月份銷售業績嚴重下滑了50.07%。而中西區域本身倉庫比較小,按照之前各區域商品物流周轉的設計,中西區域的本土供應的差額商品主要是由北方區域供應,但是北方區域由於嚴重的降雨導致物流周轉嚴重滯後,進而導致中西區域7月份銷售業績也同比下滑了17.86%。

六、通過資料分析制定業務決策

通過多維資料綜合分析方法成功定位到問題原因之後,企業及時調整倉庫商品物流周轉策略,北方區域物流模式調整為水運,同時將東南區域的部分商品通過物流周轉到中西區域。

七、評估資料分析決策效果

企業領導決策層8月份透過及時調整北方區域和中西區域的物流策略,北方區域物流模式調整為水運,東南區域的部分商品通過物流周轉到中西區域,補充了北方區域和中西區域的庫存商品周轉。最終8月份企業的總體銷售額達到了943萬,環比7月銷售額提高到了37.32%。

隨著資訊化的飛速發展,大資料產業呈指數式增長。在我們不斷地積累著企業的歷史資料的同時,如何利用和分析好這些資料,真正利用大數據分析驅動企業的業務增長也成為了一個很重要的難題。希望本文給大家分享的資料分析方法,結合FineBI商業智慧分析工具的OLAP多維分析能力,能夠讓大家下次在面對企業業務資料分析時不再迷惑,做到步步為營,讓資料分析真正釋放出潛能,驅動業務快速增長,形成資料和業務之間的閉環。

我是「數據分析那些事」。常年分享數據分析乾貨,不定期分享好用的職場技能工具。follow我的臉書,回覆10送你十週入門資料分析電子書唷,期待你與我的互動!

系列文回顧:

學習計劃|帶你10周入門資料分析

4招教你煉就資料分析的思維

數據分析慣用的5種思維方法

資料分析必備的43个Excel函式,史上最全!

實操:如何用Excel做一次完整的資料分析

寫給新人的資料庫入門指南

零基礎快速自學SQL,2天足矣!

資料視覺化技能的進階路線:SQL+BI+Echarts

數據分析必掌握的統計學知識!

不可不知描述性統計

資料分析必備的統計學(二):假設檢驗

一次讓人臉紅心跳的python數據分析

Python入門(一)環境&資料結構

Python入門(二)函數基礎

Python資料分析(三)NumPy

Python資料分析(四)Pandas

Python資料分析(五)Matplotlib做視覺化

推薦!42款好用的資料視覺化工具盤點

分享一些資料分析常用的資料視覺化圖表

【新人入門篇】資料視覺化分析不是個事兒

數據分析工具怎麽選?送你一個工具箱

寫給資料分析新人:一種通用的資料思維

這是一個專注於數據分析職場的內容部落格,聚焦一批數據分析愛好者,在這裡,我會分享數據分析相關知識點推送、(工具/書籍)等推薦、職場心得、熱點資訊剖析以及資源大盤點,希望同樣熱愛數據的我們一同進步! 臉書會有更多互動喔:https://www.facebook.com/shujvfenxi/

這是一個專注於數據分析職場的內容部落格,聚焦一批數據分析愛好者,在這裡,我會分享數據分析相關知識點推送、(工具/書籍)等推薦、職場心得、熱點資訊剖析以及資源大盤點,希望同樣熱愛數據的我們一同進步! 臉書會有更多互動喔:https://www.facebook.com/shujvfenxi/