【新人入門篇】資料視覺化分析不是個事兒

數據分析那些事
7 min readAug 22, 2019

--

此文是《10周入門資料分析》系列的第20篇

想瞭解學習路線,可以先閱讀 學習計畫 | 10周入門資料分析

最近小編收到很多幾份這樣的私信,大體是這樣的:

我以後想要走視覺化資料新聞的方向,知道需要學習程式設計,設計,以及資料庫,迷茫要怎麼入手,所以先開始學了python。求小編大大指教,應該怎樣有序有效地學習,有沒有什麼推薦的課程和書目。我大學畢業一年,自覺自己能力不夠,想要努力學習,充實自己。

所以藉此專題,為這些朋友做點指引,梳理一遍。資料視覺化入門並不困難,這裡我們從什麼是資料視覺化、資料視覺化的價值、什麼是好的資料視覺化、資料視覺化難在哪、怎麼做資料視覺化、視覺化進階路線、視覺化工具推薦、資料視覺化注意事項這八個方面簡單介紹一下,希望對你們有幫助:

一、什麼是資料視覺化?

視覺化可簡明地定義為:透過可視表達增強人們完成某些任務的效率。任何形式的資料視覺化都會由豐富的內容、引人注意的視覺效果、精細的製作三個要素組成,概括起來就是新穎而有趣、充實而高效、美感且悅目三個特徵。很多資料產品在説明資料分析的同時提供了內建的視覺化圖表,也提供了配色參考建議,諸如FineReport做的產品分析。

FineReport

二、資料視覺化的價值

資料視覺化都有一個共同的目的,那就是準確而高效、精簡而全面地傳遞資訊和知識。視覺化能將不可見的資料現象轉化為可見的圖形符號,能將錯綜複雜、看起來沒法解釋和關聯的資料,建立起聯繫和關聯,發現規律和特徵,獲得更有商業價值的洞見和價值。因此,資料視覺化能夠加深和強化受眾對於資料的理解和記憶。

三、什麼是好的資料視覺化

資料視覺化能做到準確、充實、高效、美感就是好的視覺化:

準確:用最簡單的方式傳遞最準確的資訊, 最簡單方式就是最合理的圖表,需要根據比較關係、資料維數、資料多少選擇。

充實:一份資料分析報告或者解釋清楚一個問題,需要多個指標或者同一指標的不同維度相互配合佐證分析結論。

高效:成功的視覺化,雖表面簡單卻富含深意,可以讓觀察者一眼就能洞察事實並產生新的理解。

美感:分為兩個層次,第一層是整體協調美,沒有多餘元素,圖表中的坐標軸、形狀、線條、字體、標籤、標題排版等元素是經過合理安排的 , 第二層是讓人愉悅的視覺美,色彩應用恰到好處。

四、資料視覺化難在哪?

好的產品體驗不是一件容易的事情,需要具備一定的資料分析能力、熟練使用視覺化工具、較好的美術素養、良好的用戶體驗感覺。

1. 資料不準確、結論不是很清晰,所以資料視覺化的最大難點在資料視覺化之外的基礎性工作,資料收集、資料分析沒有做好,視覺化就是徒勞無功。

2. 資料視覺化是用高度抽象的圖表展示複雜的資料、資訊,需要邏輯及其嚴密。

3. 維度多、變數多,不確定應該展示哪些資訊?資料過多,需要採用互動式的展現視覺化。

4. 和UI圖形介面相比,圖表只有有限的文圖指引,不能很好的說明資料的上下文關係。

5.圖表高度抽象,對於閱讀者素質要求很高。

6.選擇正確的圖表不容易,各類圖表都有自己的優勢和局限性。

7.圖表細節處見真功夫,圖表需要考慮細節實在是太多,佈局、元素、刻度、單位、圖例等等都需要合理。

五、怎麼做資料視覺化?

1. 明確圖表想說明什麼業務問題、業務邏輯 、資料分析結論

2. 確定關係和對比的維度,是時間趨勢、比較,還是分佈關係,對比維度(時間: 同比 環比 定基)、空間(華南 華北 區域與全國)、特定標準(實際和計畫)

3. 根據對比關係,資料維度,資料分類多少選擇合理的圖表,每一種圖表都有它自身的優點和局限性

4. 生成圖表並驗證是否正確,是否和預期一致

5. 細節調整,坐標軸(刻度標記類型、間隙、刻度標籤位置、資料類型、小數位、是否千分位)、顏色取值、圖例位置、圖上標籤、圖表標題等細節

6. 在恰當處備註文字說明,例如標注特殊事件

推薦幾本資料視覺化領域的經典圖書,小編自我感覺在網路刷碎片化的文章不如好好閱讀一本書:

《Google必修的圖表簡報術:Google總監首度公開絕活,教你做對圖表、說對話,所有人都聽你的!》

《資料之美:優雅資料解決方案的幕後祕辛》

六、視覺化進階路線

資料視覺化一般是整個資料分析鏈路的最後一個環節。在資料視覺化之前,我們需要對原始資料進行大量的整理和清洗處理,這一環節首選資料庫SQL,資料處理之後才是分析和視覺化。資料視覺化有兩個方向很值得去嘗試:商業智慧BI與動態交互圖表

SQL是資料分析師的核心技能之一。有些公司並不給資料庫許可權,需要分析師寫郵件提需求,這非常不好。資料分析師經常有各類假設需要驗證,很多時候寫十幾行SQL就能得到的答案,還得麻煩其他部門匯出資料。

所以,這裡推薦一個資料視覺化技能的進階路線:SQL+BI+Echarts,參考下小編之前的文章:

七、視覺化工具推薦

對於資料視覺化,有諸多工具,如:

1、圖表類外掛程式:ECharts、Highcharts、D3js等功能都十分強大。

2、資料包表類:Excel、FineReport等,對於日常的報表製作,更加易學實用。

3、BI工具:FineBI、Tableau、PowerBI等,自助式分析和視覺化工具,學習資源很多。

(小聲說,小編公司內部用的工具是帆軟FineReport ..XD)

八、視覺化過程的注意事項

總結幾點注意事項,少走些彎路:

1. 資料圖表主要作用是傳遞資訊,不要用它們選技巧,不要追求過分漂亮,以反映業務問題為主

2. 不要試圖在一張圖中表達所有的資訊,不要讓圖表太沉重,適得其反

3. 資料視覺化是以業務邏輯為主線串聯,不要隨意堆砌圖表

4. 避免過度開發,什麼資料都想展現,資料太多就選擇最核心的資料指標、和正常偏差大的、能支援分析結論的

5. 不要試圖掩蓋問題,回避「不良結論」,真實反映業務,暴露問題

6. 避免過度設計,一般不適用3D、陰影,合理運用色彩同樣能讓圖表顯示的很高級

>>>

我是「數據分析那些事」。常年分享數據分析乾貨,不定期分享好用的職場技能工具。

已經有3000+的同好按贊我的臉書了,你不來嗎?XD

系列文:

學習計劃|帶你10周入門資料分析

4招教你煉就資料分析的思維

數據分析慣用的5種思維方法

資料分析必備的43个Excel函式,史上最全!

實操:如何用Excel做一次完整的資料分析

寫給新人的資料庫入門指南

零基礎快速自學SQL,2天足矣!

資料視覺化技能的進階路線:SQL+BI+Echarts

數據分析必掌握的統計學知識!

不可不知描述性統計

資料分析必備的統計學(二):假設檢驗

一次讓人臉紅心跳的python數據分析

Python入門(一)環境&資料結構

Python入門(二)函數基礎

Python資料分析(三)NumPy

Python資料分析(四)Pandas

Python資料分析(五)Matplotlib做視覺化

推薦!42款好用的資料視覺化工具盤點

分享一些資料分析常用的資料視覺化圖表

--

--

數據分析那些事
數據分析那些事

Written by 數據分析那些事

這是一個專注於數據分析職場的內容部落格,聚焦一批數據分析愛好者,在這裡,我會分享數據分析相關知識點推送、(工具/書籍)等推薦、職場心得、熱點資訊剖析以及資源大盤點,希望同樣熱愛數據的我們一同進步! 臉書會有更多互動喔:https://www.facebook.com/shujvfenxi/

No responses yet