從0到1快速入門資料分析,一套通用的分析指南待收!

最近收到了不少朋友的問題:做運營的想入門資料分析應該怎麼學?新手做資料分析有哪些好用的工具?會用Excel但是做分析總是沒思路怎麼辦?今天就用這篇文章統一回答關於資料分析的種種問題

資料分析是什麼?

很多人都沒有搞懂資料分析是什麼。經常聽到有人說投了資料分析的崗位,結果入職之後每天干的活就是取數給業務用,感覺自己就像個取數機。這樣的工作根本不能叫做資料分析。

什麼是資料分析,資料分析的流程包括:目標確定 — — 資料獲取、清洗、整理 — — 資料分析 — — 結果呈現,詳細地說,就是將獲取後的資料用分析手段加以處理,並發現業務價值的過程。

資料分析需要哪些能力

資料分析師需要會哪些技能,圍繞上面資料分析的基本流程,我把資料分析師的能力分爲這樣三大部分:基礎知識工具技能分析方法與思維

以下師資料分析的技能大綱,圖中標記了能力等級,大家根據自己的情況對應學習:

資料分析必備能力1.0 — — 基礎知識

資料分析基礎知識需要掌握的是統計學機器學習

統計學

毫不誇張地說統計學是整個資料分析的靈魂。判別一個資料分析師強弱的一個重要方法就是看他對統計規律的敏感度。這裏我們需要從基礎的統計理論(描述性統計、區間估計、假設檢驗等)出發,到基本的統計分析(T檢驗、方差分析等),最後到商業常用的模型(迴歸分析、方差分析等),學習資料分析背後的邏輯,掌握實用統計學的概念和會利用統計的思維去思考問題。

推薦書籍:《深入淺出數據分析》、《統計學習方法》(李航)。《深入淺出數據分析》這本書非常推薦作爲小白的入門書籍,特別是之前沒有接觸過資料分析的。特點和書名一樣深入淺出,圖多而且沒有那麼多公式和理論,對於統計的基本原理以及統計問題的來源場景介紹的非常通透,非常符合深入淺出系列定位。如果有之前有一定基礎,建議略過。

機器學習

對於想要進階成爲高級資料分析師的朋友來說,就要掌握機器學習相關的知識:

特徵工程的基礎:如何統計資料特徵、選用不同的特徵,做模型的優化;

基本的分類算法:決策樹、隨機森林等;

基本的聚類算法、資料挖掘、常見的機器學習算法的瞭解等機器學習相關的知識學習成本會比較高,對某些同學來說可能會有一定難度,但對於業務型資料分析師來說,一般不會要求你去推導算法公式,能做到明白不同算法的適用場景、優缺點、原理大概懂就基本可以了。

推薦學習書籍:《機器學習》周志華

資料分析必備能力2.0 — — 資料分析工具學習

  1. PPT

爲什麼把PPT放在第一,原因很簡單,我們做資料分析的目的是什麼?當然是爲了展示給客戶、上級,供他們做決策。所以PPT作爲主流彙報、展示工具,是將分析關鍵結果傳遞給其他的重要手段。學好PPT可以提升溝通和消息傳遞效率,也是資料分析師必備的技能。

2、EXCEL

EXCEL應該是資料分析師最常用的統計分析工具了,原因是方便,所見即所得,而且具有方便的視覺化功能。應該說只有學會了Vlookup,資料透視和基本公式纔算EXCEL入門。其次EXCEL最大的驚喜是資料視覺化,擁有大量的圖表模板,可以減輕我們很多工作。這裏我推薦《誰說菜鳥不會數據分析》這本書作爲EXCEL入門。這本書如果作爲資料分析入門書籍是不合格的,因爲它有太多內容是關於EXCEL基本操作的,關於資料分析的內容反而很少,但是實事求是地講這本書裏面關於EXCEL資料分析常用公式、資料視覺化的內容還是不錯的,可以當成一本入門書籍。

3. ACCESS

爲什麼把ACCESS作爲中級資料分析師必備技能,原因很簡單,當資料太大,EXCEL又處理不了,又沒有很強的編程基礎怎麼辦?ACCESS的優勢就體現出來了,它可以在不用掌握很高深編程語言的條件下,處理Excel所不能承載的大存儲量的資料原始文件,速度很快,且易學易用。作爲入門,我推薦《表哥的Access入門》這本書。通過一個簡單的小飯館資料庫管理程序的開發過程,對理解資料庫和學習一些基本的ACCESS很有幫助。

4、SQL

作爲資料分析人員,要想獲取資料,肯定就要和資料庫打交道,因此sql肯定是要掌握的,在招聘要求中,sql也是很多資料分析崗位的能力要求之一。學習SQL最快的方法是能自己下載資料庫管理工具,找些資料練習,主要了解一些資料庫查詢語言,where,group by,orderby,having,like,count,sum,min,max,distinct,if,join,left join,limit,and和or的邏輯,時間轉換函數等。這裏推薦《MYSQL必知必會》

5、Python

作爲目前最火的編程軟件之一,確實在資料分析、資料挖掘上有着獨特優勢。是否具備編程能力,也是初級資料分析和高級資料分析的分水嶺。以下以python的學習路線圖:

看起來要學習的內容挺多的,但其實python最大的優勢就是語言簡約,非常易於讀寫,如果之前有一定的編程基礎,上手很快。推薦書籍《Python編程快速上手》,新手可以跟着書裏的內容一步步做,把裏面的項目做完,差不多就入門了

6、商業資料分析軟件

excel做資料分析難以解決大數據量的問題,對沒有編程基礎的人來說上手python又比較難,這時候可以選擇利用資料分析軟件來做資料分析,現在市場上的資料分析軟件基本都涵蓋來資料採集、處理、分析到視覺化展現的過程,操作簡單,視覺化效果很棒,比較適合新手入門。比較好用的有FineBI、tableau 等等

資料分析必备能力3.0 — — 資料分析法和数据思维

學習資料分析肯定有人上網百度了不少資料分析方法,什麼漏斗分析法,PEST,SWOT模型、杜邦分析法等等。關於分析方法值得一說的就是一定要結合行業特點,特別是對業務的掌握,這樣才能事半功倍。下面簡單列幾個比較通用的分析方法:

1、對比分析法

對比分析法常用的基礎分析方法,雖然方法特別簡單,但幾乎所有的分析報告中,都會採取對比分析方法。比如去年同期相比、上個月環比、目標和實際達成相比、各個部門和業務線相比、行業內競品比較、營銷效果對比,等等。這裏需要注意的是我們不管是橫向比較還是縱向比較,比較的雙方一定要有可比性,並且在同一個維度、粒度上去比較,要不是毫無意義的。

2、5W2H分析法

這個方法主要應用於用戶行爲研究和專項問題分析,從時間、地點、人物、事情、原因、方式、價格等7個方面對一個問題進行刻畫研究。

3、SWOT

明確資源優勢(Strengths)、競爭劣勢(Weaknesses)、外部環境變化帶來的機會(Opportunities)和威脅(Threats)等,將這些因素有機結合起來,以此確定企業經營戰略。

4、PEST

從政治(Politics)、經濟(Economics)、社會(Society)、技術(Technology)4個視角分析外部環境。

5、杜邦分析法

杜邦分析法是一種用來評價公司盈利能力和股東權益回報水平,從財務角度評價企業績效的一種經典方法。其基本思想是將企業淨資產收益率逐級分解爲多項財務比率乘積,這樣有助於深入分析比較企業經營業績。

如何培養資料思維培養

分析思維是資料分析師最最核心的競爭力,上面所學習的python、sql、機器學習知識等都是在工具層面,要想使用好他們,還需要分析思維的駕馭。對於分析思維的學習,我建議新人也是從讀書開始,我看過的且比較推薦的書包括:

資料分析類《精益數據分析》、《增長黑客》、《數據化管理:洞悉零售及電子商務運營》、《數據挖掘與數據化運營實戰 思路、方法、技巧與應用》

產品思維類如果是想要從事互聯網行業的資料分析師的話,產品思維也是必須要具備的,面試考察點之一,推薦《從點子到產品:產品經理的價值觀與方法論》、《俞軍產品方法論》、《產品思維》邏輯思維類在面試中邏輯清晰的回答面試官的問題,會爲你大大的加分,推薦《金字塔原理》、《學會提問》、《麥肯錫思維》

一步一步來,從簡到難,你也可以成爲優秀地資料分析師。

附贈書單

統計學:《深入淺出數據分析》、《統計學習方法》(李航)

機器學習:《機器學習》周志華

SQL學習:《MYSQL必知必會》

Python學習:《Python編程快速上手》

資料數據分析思維:《精益數據分析》、《增長黑客》、《數據化管理:洞悉零售及電子商務運營》、《數據挖掘與數據化運營實戰 思路、方法、技巧與應用》

產品思維:《從點子到產品:產品經理的價值觀與方法論》、《俞軍產品方法論》、《產品思維》《金字塔原理》、《學會提問》、《麥肯錫思維》

這是一個專注於數據分析職場的內容部落格,聚焦一批數據分析愛好者,在這裡,我會分享數據分析相關知識點推送、(工具/書籍)等推薦、職場心得、熱點資訊剖析以及資源大盤點,希望同樣熱愛數據的我們一同進步! 臉書會有更多互動喔:https://www.facebook.com/shujvfenxi/