一份完整的資料分析師成長書單

數據分析那些事
11 min readFeb 21, 2022

--

如何快速成為資料分析師?

資料分析是一門專業且跨越多個領域的學科,想要成為任何一名資料分析師就需要掌握相關的專業技能。

然而許多跨入這個行業或者說已經在這個行業工作的人是半路出家,或者是純粹的小白,沒有基礎或基礎不牢,想要學習卻沒有頭緒。

但大家都有一個共同點,即迫切的想要快速邁入資料分析師這個門檻,在短時間內高效的掌握資料分析的知識和並找到一份相關的工作。

這個時候學習資源就尤為重要了,如果有好書作為參考,對資料分析能力的成長更有幫助。
下面推薦的書單,是一個相對完整的入門學習體系,內容較多,建議大家採取階段性學習。

01基礎-統計學

統計學是資料分析方法論中的核心基礎,在資料分析的方法模型中,很大程度上都來源於統計學的方法,所以掌握統計原理是必須的。

1《數學之美》 吳軍 著

此書名為數學之美,實為資訊科技(自然語言處理)中的數學原理(統計語言模型)之美。

更深刻地理解大學所學的線性代數、機率論與數理統計和應該學而沒學的隨機過程、圖論、機器學習的應用意義。

書中將高深的數學原理講得更加通俗易懂,讓非專業讀者也能領略數學的魅力。

讀者說,讀了“數學之美”,才發現大學時學的數學知識,原來都如此親切,並且栩栩如生,才發現自然語言和資訊處理這麼有趣。

2《深入淺出統計學》Dawn Griffiths 著;李芳 譯

《深入淺出統計學》具有“深入淺出”系列的一貫特色,提供符合直覺的理解方式,讓統計理論的學習既有趣又自然。

從應對考試到解決實際問題,無論你是學生還是資料分析師,都能從中受益。

3《統計學習方法》李航 著

系統地介紹了統計學習的主要方法,特別是監督學習方法,包括感知機、k近鄰法、樸素貝葉斯法、決策樹、邏輯斯諦迴歸與最大熵模型、支援向量機、提升方法、EM演算法、隱馬爾可夫模型和條件隨機場等。

這些是之後可以直接應用到你的資料分析專案中去的一些方法。從統計向機器學習深入和過渡,對目前目前的統計學習方法有全面的介紹。

02 入門-資料分析

當了解了統計學的一些基礎知識之後,你就可以正式上手學習較為基礎的資料分析知識了。

這一部分主要是瞭解資料分析和資料探勘的方法、工具等理論上的東西,是為後續的資料分析實戰打好基礎。

1《深入淺出資料分析》Michael Milton 著;李芳 譯

資料分析入門的經典書籍了,你會發現幾乎每個給你推薦資料分析、資料探勘書單的人都會推薦此書。

此書最大的優點就是非常的簡明易懂,還給你填了很多統計方面的坑,讓沒有統計知識的你不至於一臉懵逼。

資料分析基本步驟、實驗方法、最最佳化方法、假設檢驗方法、誤差處理、相關資料庫、資料整理技巧等相關知識都有介紹。

2《資料探勘導論》Pang-Ning Tan,Michael Steinbach 著;範明 範宏建 譯

這絕對是你進入資料分析和資料探勘領域的核心書籍,也是資料探勘的入門經典。

書中對資料、分類、關聯分析、聚類和異常檢測作出了細緻入微的闡述。還有一些常用的資料探勘演演算法和虛擬碼,可以作為延伸學習。

當然資料探勘的東西更多的是要去理解,而不是記憶,理解理論背後的原理會讓你在後續的實戰中能夠更加得心應手。

3《資料探勘概念與技術》Jiawei Han,Micheline Kamber 著;範明 孟小峰 譯

這本書的定位和《資料探勘導論》的定位比較相似,都是在資料探勘、分析技術的問題上的探討。

這本書雖然名為data mining,但其實思想都是machine learning的東西,這也可以是一個瞭解機器學習的不錯的切入點。

03實戰-資料技術

經過前面對於資料分析和資料探勘知識的積累,相信你已經形成了最基本的資料分析知識體系,也對資料分析的方法和流程有了較為全面的瞭解。

那麼接下來就需要上手實踐了,做資料分析的工具有很多,比如大家常見的excel,還有python、R等程式語言,這裡首推python。

1《利用python進行資料分析》Wes McKinney 著;唐學韜 譯

此書絕對是計算科學和資料分析經典中的經典,強大的地方在於,書中不僅建立了一個完善的python分析方法論體系,還有大量具體的實踐建議,以及大量綜合應用方法。

將學會如何利用各種Python庫(包括NumPy、pandas、matplotlib以及IPython等)高效地解決各式各樣的資料分析問題,所以這將是你真正意義上資料分析實戰的開始。

2《python核心程式設計(第二版)》Wesley J. Chun 著;CPUG 譯

要用python進行資料分析,學習python這門語言是必須的了,這本書就是python程式設計的經典。

尤其是每一小節後面的核心筆記,講解了一些有用的程式設計技巧和知識,知識點非常細緻,你可以學到很多以前不知道的程式設計知識。

當然這本書用來掃盲可能有一定的難度,可能更適合進階,讓你打紮實python 的基礎。

3《python資料分析與挖掘實戰》張良均 王路 等 著

從資料探勘的應用出發,以電力、航空、醫療、網際網路、生產製造以及公共服務等行業真實案例為主線,深入淺出介紹Python資料探勘建模過程,實踐性極強。

透過這本書,你完全可以閱讀過程中,充分利用隨書配套的案例建模資料,藉助相關的資料探勘建模工具,透過自己進行上機實戰掌握Python的資料分析。

補充-資料庫

在涉及到大量的資料之後,資料的儲存可能會成為你要考慮的問題,所以關於SQL方面的知識作為一個數據分析師應該有所儲備。好在這部分難度並不是很大,並且不要要特別深入的研究。

1《深入淺出SQL》貝里 著;O‘Reilly Taiwan公司 譯

非常淺顯易懂, 圖表間的註釋是本書精華所在。細緻到幾近囉嗦,小白都可以輕鬆看懂,可能是因為資料庫技術本身難度並不是特別大。

作為入門的書相當的不錯,有輔助理解的講解和例子,同時有有練習題加深記憶。

當然書的內容略多,如果你是需要快速學習的話,在你已經理解之後就不必過度扣細節,畢竟你可能需要更多在實戰中應用。

2《高效能mysql》Baron Schwartz 等 著;王小東 李軍 康建勳 譯

分享MySQL實用經驗的圖書,它不但可以幫助MySQL初學者提高使用技巧,更為有經驗的MySQL DBA指出了開發高效能MySQL應用的途徑。

書中的知識點非常全面,但可能學習成本略高,並非全要掌握,作為遇到困難時的詞典查閱也不錯。

04進階-機器學習

經過前面的學習,你基本上已經能夠進行簡單的資料分析,並且能夠較為完善地操作一些簡單的資料了。

那麼機器學習這部分一定是提升你整個思維方式和資料分析水平的殺器。你將會有目的地去選擇合適的方法應用在不同的場景,分析水平得以提升。

1《機器學習》周志華 著

簡明而深刻,厚積薄發的評註非常開拓思維,多是遊刃有餘之後才可得出的見解。

這確實是機器學習裡優秀的中文書籍了,大牛周志華將機器學習中的模型方法,應用場景、理論推導、最佳化過程、演算法等進行了全面而細緻的講解,堆積初級的宏觀學習機器學習分析方法可以說是既簡潔而又實用。

2《機器學習實戰》Peter Harrington 著;李銳 李鵬等 譯

這本書會讓你意識到那些被吹捧得出神入化的分類演算法,竟然實現起來如此簡單;

那些看似高深的數學理論,其實一句話就能道明其本質;一切複雜的事物,出發點都是非常簡單的想法。

3《集體智慧程式設計》TOBY SEGARAN 著;莫映 王開福 譯

以機器學習與計算統計為主題背景,述如何挖掘和分析Web上的資料和資源,如何分析使用者體驗、市場營銷、個人品味等諸多資訊,並得出有用的結論。

想把 paper 上的公式轉變為可以執行的程式碼,這是件考驗功力的事情這本書就是是修煉此種功力的武林秘笈之一。

最顯著的特點是,實戰性極強!針對每個演算法,他從頭到尾演示了一個完整的實現過程:從獲取資料,組織儲存,到演算法實現,載入運算,再到最後的結果的分析利用。

05 應用-商業資料分析

經過上面的技能學習,我相信你已經具備了一名資料分析師的核心技能,接下來,你就需要在專業的領域進行深耕,不斷積累技術經驗和強化業務能力。

此時許多小夥伴可能已經開始從事資料分析師的工作,而資料分析這項技能所能進入的行業範圍廣,涉及的領域也非常多,你可以根據自己的業務方向來進行書籍的選擇,下面推薦的則是比較通用的。

1《精益資料分析》Alistair Croll 等 著;韓知白 王鶴達 譯

這本書裡講解了創業公司該如何確定指標體系,如何用資料指導產品和運營。本書還針對電商、媒體、SaaS、雙邊市場、UGC等,列舉了要關注的指標,並有豐富的案例。

整個書的內容比較散,但依舊是講網際網路產品資料分析方面非常好的書了,對於想就職網際網路資料分析的人來說非常實用。

2《網站資料探勘與分析》宋天龍 著

本書是目前網站資料探勘與分析領域最具系統性、深度和商業實踐指導價值的著作,由來自線上資料分析領域巨擘Webtrekk的官方資深資料分析專家撰寫。

本書從認知、技術、應用、管理和工具5個維度對網站資料分析進行了全面的講解。具體內容包括: 科學地認識網站的資料分析 ; 從零開始建立企業資料體系 ; 網站資料採集和配置等。

3《資料分析:企業的賢內助》陳哲 著

本書章節邏輯清晰,從企業的一個個具體的需求出發,使讀者對資料分析的瞭解循序漸進,將複雜的資料分析知識體系串成有機的整體。

以企業經營中的案例為依託,將複雜的資料分析知識巧妙地融入其中,完整呈現資料分析專案的流程,系統闡述資料分析的專業思路、方法和技能!

如何學習

這一套推薦下來,需要讀的書並不少,不要覺得頭大,其實根據推薦的步驟已經給出了一條明確的學習路徑,即“統計學基礎-常用模型理論-程式語言和資料庫技術-機器學習方法”。

這些書不必一一啃下來,以所列出的技能為目標學習即可。已經學過的知識也不必回爐重造,比如你之前就有統計的基礎,那麼統計學部分的書你就沒必要看了。

但更重要的是,不要只看書,要儘快讓自己步入實踐階段。資料分析作為一門技術,只有在不斷地操作當中才能掌握真正的技巧和方法,將知識學以致用。

最後,希望大家在成為資料分析師的路上越走越遠~

立即試用FineBI免費版:

https://intl.finebi.com/zh-tw/trial?utm_source=Medium_Banner

※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※

我是「數據分析那些事」。常年分享數據分析乾貨,不定期分享好用的職場技能工具。各位也可以關注我的Facebook,按讚我的臉書並私訊「10」,送你十週入門數據分析電子書唷!期待你與我互動起來~

文章推薦

人人都值得一看!最值得推薦的財務書籍和學習方法

不想再用Excel手工整理週報的你,是時候學會套用自動化模板了

做的報表太醜總被吐槽?學會這6招後做出的報表,好看又實用

整理30份酷炫視覺化大屏模板,一個程式碼不用敲,半天學不會來找我

--

--

數據分析那些事

這是一個專注於數據分析職場的內容部落格,聚焦一批數據分析愛好者,在這裡,我會分享數據分析相關知識點推送、(工具/書籍)等推薦、職場心得、熱點資訊剖析以及資源大盤點,希望同樣熱愛數據的我們一同進步! 臉書會有更多互動喔:https://www.facebook.com/shujvfenxi/