雖然資料分析看上去條條框框多,但是實際上沒有想象中那麼難,很多人缺少的只是一個科學規劃的學習過程。數據君簡單盤算了一下資料分析的入門知識,大體分為以下這些,只要你每週夯實一個基礎,基本能學成,話不多說,下面就是用十週入門資料分析師的學習清單!
十週學習大綱總計畫
1. 資料分析的思維和方法
2. Excel進階
3. 資料庫和SQL入門
4. 數理統計學資料分析
5. 軟體應用
6. 資料視覺化
7. 常見的業務分析模型
8. Python/R語言掌握
9. 業務理解和指標設計
10 增長駭客:資料驅動增長
第一週:培養資料分析思維
為什麼資料分析思維很重要?如果我們在分析一個問題前,思維缺失就像下面圖中所表達的一樣,往往不知道問題從哪裡下手,即使拿到資料也是一臉懵逼。所以我們要透過訓練資料分析思維,幫助在遇到問題時,大家腦中能快速梳理出分析的切入點以及思路,這一點很重要。
常用的一些思維方式:
1、金字塔/結構化思維:把待分析問題按不同方向去分類,然後不斷拆分細化,能全方位的思考問題,一般是先把所有能想到的一些論點先寫出來,然後在進行整理歸納成金字塔模型。主要透過思維導圖來寫我們的分析思維。
2、公式化思維:在結構化的基礎上,這些論點往往會存在一些數量關係,使其能進行+、-、×、÷的計算,將這些論點進行量化分析,從而驗證論點。所謂指標體系,就是這麼梳理得來的。
3、業務化思維:業務化即是深入瞭解業務情況,結合該專案的具體業務進行分析,並且能讓分析結果進行落地執行。用業務思維去思考,站在業務人員或分析物件的角度思考問題,深究出現這種現象的原因或者透過資料推動業務。透過貼近業務,換位思考,積累經驗來增加業務思維。
同時,這樣的思維模式在一些特定業務場景下,還衍生出一些基礎的分析方法,比如象限法、多維法、假設法、指數法、二八法、對比法、漏斗法,這個對未來構建分析模型都有幫助。
思維模型的好處是他能提供一種視角或思維框架,從而幫助你建立起觀察事物和分析問題的視角。透過對思維模型的學習和訓練,能提高你成功的可能性。
第二週:Excel技能進階學習
Excel是一個循序漸進的過程基礎的:
1. 簡單的表格資料處理、篩選、排序
2. 函式和公式:常用函式、高階資料計算、陣列公式、多維引用、function
3. 視覺化圖表:圖形圖示展示、高階圖表、圖表外掛
4. 資料透視表、VBA程式開發
按照數據君習慣的方法,先過一遍基礎,知道什麼是什麼,然後找幾個case練習。多逛逛Excelhome論壇,平常多思考如何用Excel來解決問題,善用外掛。
函式和資料透視表是兩個重點,結合業務場景來學習。其中資料透視表的作用是把大量資料生成可互動的報表,實現分類彙總、取平均、最大最小值、自動排序、自動篩選、自動分組;可分析佔比、同比、環比、定比、自定義公式。
當然,受制於單機、工作效率低下等缺點,現在市場上出現了一些更智能便捷的報表工具,在本週的學習中,你也可以去了解學習。
推薦學習資料:報表工具學習
第三週:學習資料庫原理和SQL
做資料分析,資料從哪裡來?資料庫!怎麼取資料?寫SQL!
做資料分析,取數、清洗資料,基本都要依賴SQL。
初入門階段,對於資料庫不必精通,只需瞭解常用的資料庫型別,能夠在現有的表格裡面查詢出資料,能夠更新資料對資料進行重編碼,知道怎麼增加新增資料,把資料變得規整就行。
理解主鍵,索引等含義和用處;匯入匯出資料可以使用工具,分析資料可以使用ODBC或者其他的介面對資料庫進行連線;取數的排序,做資料的交集並集,資料轉換,資料表合併等等這些,最好也能掌握。
推薦學習資料:sql的學習,看這個就夠了:SQL教程網址:https://www.w3cschool.cn/sql/
第四周:數理統計學
統計學是資料分析師必備的基礎知識之一,是一組用於彙總資料和量化給定觀測樣本域屬性的工具。
這一週,我們需要掌握統計學的以下幾大概念:
1.集中趨勢(中數、眾數、平均數)
2.變異(四分位數、四分位距、異常值、方差)
3.歸一化(標準分數)4.正態分佈
5.抽樣分佈(中心極限、抽樣分佈)
6.估計(置性度、置信區間)
7.假設檢驗
8.T檢驗
學習資料推薦書籍:吳喜之-《統計學·從資料到結論》,也可參考數據君所發文章 如何學好統計學
第五週:資料分析軟體應用
有了資料分析思維基礎,懂一些統計學知識之後,我們就可以著手開始相對專業的分析,用視覺化的方法探索資料的規律。這一週,除了Excel,你需要掌握一個傍身的資料分析工具。
考慮到快速入門,這裡暫時放一放SPSS、R、Python一類工具,先掌握BI工具的運用,幫助快速熟悉起資料分析的流程。知名的BI產品有Tableau,Power BI,FineBI等網上都有體驗版和免費版下載。處理好的資料拿來放BI分析,分分鐘就能出很漂亮的視覺化,比Excel的圖表高級許多,而且對新手十分友好,絕大多數人都能輕鬆上手。
BI需要掌握資料的連線,還有儀表盤Dashboard的概念,知道絕大多數圖表適用的場景和怎麼繪製,維度和指標的區分。一些資料的清洗,如果BI掌握得透徹也可以放BI處理,但不熟悉的話資料君還是建議用SQL處理吧。
第六周:数据視覺化
看似是简单的步骤,但也是有造诣的。
視覺化说簡單來說是一种表达,数据分析结果表达的是否到位,數據可視化的使用者(也就是你的業務方或領導)是否認同。
- 如何选择最佳的图表类型?趋势性、相关性、分布性、周期性、地理位置分布性……
- 如何進行更加美觀的調配?顏色、字體、大小…
- 如何布局?故事性布置、可视化仪表板、报告的标题和结论注释,整体展现的逻辑性….
还有很多可视化的陷阱,都是值得花一周探究的。
這裏數據君推薦報表專業的報表軟件FineReport,三種報表模板下支持三十多種圖表樣式,也可繼承第三方插件,數據可視化的選擇多樣且齊全。
學習資料參考數據君文章:資料視覺化大全
第七週:常見的業務分析模型
基於一些資料分析方法,如象限法、多維法、假設法、指數法、二八法、對比法、漏斗法,在特定業務場景下,還衍生了通用的業務分析模型,常用的有購物籃分析模型,RFM模型,漏斗分析模型,客戶生命週期,以及預測、聚類分析等挖掘模型。
這一週我們要掌握常用的分析模型,最好能有深刻的認識,直接套用到實際的業務場景中,活學活用。
學習資料可參考數據君文章:資料分析七種分析套路總結
第八週:Python/R語言掌握
到這一週,資料分析的入門之路基本上完成一大半。本著提升自己,以及加大自己求職和麵試的籌碼,掌握Python或R絕對是加分項。
有關資料分析的程式語言有Python和R語言。R語言傾向於統計分析、繪圖等。統計學家或者學統計學的喜歡用R語言,而數據君更青睞學習Python,因為Python是面向未來的語言,無論從流行度、可用性還是學習難度來講,Python都是最好的入門語言。
Python有很多分支,但我們學習的主題是資料分析,入門推薦《深入淺出Python程式設計》從code academy開始學起,完成上面的所有練習。
其次,掌握三個庫Numpy、Pandas、Matplotlib。
學習資料可參考數據君文章:Matplotlib知識體系樹立
第九周:業務理解和指標設計
到了第九周,大家可以發現,這個學習計劃更多是偏業務的資料分析,可見業務理解的重要性。但業務理解需要多年的積累,沒有掌握的捷徑。剛入門也不會拷問太多業務上的問題,更多時候是考驗你邏輯思維能力和資料分析的方法。所以簡單花一週時間瞭解各行業的業態,各業務的通用指標。
其次,指標體系。幾乎一個數據崗的崗位要求都會涉及這樣一句話:“負責建立和最佳化部門的資料指標體系”。事實上目前大多的資料崗主要工作都是不斷完善與最佳化資料指標體系,而對層面的工作是比較少的,即使崗位叫做資料分析師 。一個優秀的資料指標體系,不僅能讓你快速解決資料需求,洞察出可能會被忽略的價值資料,還能反映出你目前最需解決的業務問題。所以,這一週還要掌握梳理業務指標的思路。
學習資料 :如何建立指標體系?
第十週:資料驅動&增長駭客
這個話題比較嚴肅,需要把資料分析師這個崗位放到整個公司甚至整個行業來看。任何一個崗位的設定都是要為企業帶來價值或利潤的,資料分析師也是如此。要搞清未來價值所在,升職加薪之路才會明朗。
目前有一個非常火的詞來形容一類資料分析師,叫“增長駭客”,所做的事也很時髦,叫“資料驅動”。字面意思很好理解,就是利用資料分析技術給業務帶來增長,驅動企業轉型。
本週,你要了解業界不管是傳統行業還是網際網路行業資料驅動業務增長的成功案例。未來成為增長駭客要做好哪些準備?日常工作中,如何讓自己避免成為“取數機”?如何推動資料分析工作並得到老闆重視?工作中有哪些工作細節,去潛移默化的改變身邊人尤其是老闆對資料價值的認知?
推薦學習資料:增长黑客,看这篇就够了。
最後,資料學習是一個系統,並不僅僅是一個工具或一種程式語言那麼簡單,數據君希望大家愉快,早日入門資料分析。