最近好多人想要讓我整理書單出來,方便大家進行資料分析的入門學習。我也相信不少朋友看過我寫的十週入門數據分析系列文,對於初學者來學習,我會按照這十週階段對應的內容來推薦書籍,每個階段推薦1~2本,盡快幫助大家理解理論基礎。其實書籍不在多,而在於精,尤其是對於資料分析來說,重要的不是看了多少書籍,而是從書籍中獲得了多少資料分析知識,掌握了多少分析技能,學會了多少分析思維。
另外,如果你有更好的優質書籍分享給大家歡迎評論留言,讓我們一起學習一起進步!
和十週入門資料分析搭配一起使用,聽說更配喔!
第一階段書籍推薦:資料分析的思維和方法
《金字塔原理》
這本書沒有帶來石破天驚的神奇理論,更多的是實踐的總結與提煉。並且讀的過程中你往往會有似曾相識的感覺。而人家把你日復一日的熟視無睹總結提煉成金字塔原理,從此在邏輯表達這塊站穩一席之地。金字塔原理簡單說就是,任何事情都可以歸納出一個中心論點,而此中心論點可由三至七個論據支援,這些一級論據本身也可以是個論點,被二級的三至七個論據支持,如此延伸,狀如金字塔。
《深入淺出數據分析》
把這本書籍放在第一順序,是因為它真的很簡單,但是能夠讓你對資料分析的一些基本概念有大致的瞭解。即便是你毫無資料分析經驗,一兩天也足夠讀完整本書了。這本書的實操性並不強,所以也不建議你去跟著實踐,瞭解作者傳達出來的資料分析基本思想和原則就OK了,這對你建立宏觀的視野,和接下來的學習很有幫助。
閱讀建議:
要先理解資料分析的思維,然後多觀察生活周邊的事物,嘗試著自己來進行分析,鍛煉自己的資料觀察和分析能力與思維,這本書籍能夠説明資料分析師建立結構化思維和資料思維。深入淺出這本書有提到一些案例,比如提升化妝品銷量、分析星巴克銷量、生產線最優解、網站ABtest、競品分析、薪資預測等等,看起來很簡單,但其實都是工作最常見的一些分析場景,所以建議先快看後細看。
第二階段推薦書籍:Excel進階
資料分析的啟蒙階段必須是Excel,如果你是還沒有接觸過資料分析,對於這個領域一無所知,那麼這本《誰說菜鳥不會資料分析》是非常適合你的,主要是進行Excel的資料處理與分析、視覺化,是新手入門的必讀經典讀物。對於初級使用者,十分推薦彭亮的《不加班早下班的創意Excel玩法》,主要講思路,很適合入門,簡單易懂,有詳盡的案例,有更巧妙的技法,讓Excel技能不再受行業、職位所限。
日本暢銷多年的Excel工具書,日文書名是「外資系投資銀行のエクセル仕事術」(直譯為:外資投行的Excel工作術)《為什麼精英都是Excel控》對Excel的技巧介紹的並不多,作者最想說的是使用Excel時候,要始終保持團隊思維。任何一個面向客戶的Excel檔,都不會只經過自己手裡,必然會有自己的teamleader或者是supervisor去審閱,所以始終站在第三者的角度去看自己的Excel,讓自己的工作成果也被他人理解,是這本書籍的核心思想。正因為如此,要讓自己的工作簡單易懂,簡單不是起點,恰恰是努力的終點。
閱讀建議:
關注Excelhome 論壇以及看看論壇出的書,這個大家都應該知道!不過我覺得短視頻也是個學習方向,給你個思路,自己做一遍能學到很多東西。每天5分鐘excel操作技巧,每天進步一點點。
第三階段推薦書籍:資料庫理解和SQL入門
掌握了第一階段的Excel分析之後,我們接下來就要進行SQL技能的提升和學習。Excel是偏向於統計,而SQL偏向於資料庫,如果大家面試了資料分析職位,只是使用Excel來用處理,甚至資料庫權限都沒有的話,建議不要去就職,這樣的職位含金量是不高。
這個時候我推薦給大家兩本書:《MySQL必知必會》和《SQL必知必會》。這兩本書介紹了比較簡單的SQL基礎知識,從介紹簡單的資料檢索開始,逐步深入一些複雜的內容,包括聯結的使用、子查詢、規則運算式等。
閱讀建議:
剛學習SQL的時候,建議大家還是搭配看些視頻的,因為一開始肯定對書籍上的內容感覺到枯燥,畢竟是沒有操作,所以還是跟著視頻來模仿進行比較好,這樣也是有成就感的另外大家工作之後或者感覺上面的sql內容沒有難度的話,就看看最貼近工作中sql查詢的書籍吧!
第四階段推薦書籍:數理統計學
統計學有什麼用呢?給大家一個學習統計學的理由就是面試的時候要求統計學和機器學習內容。
最後再給大家一個學習的動力,通過學習統計學能夠明白生活中的更多真相,來把,先從下面的這本來開始 — — 《赤裸裸的統計學》
前面的書讓你知道了學習的意義是什麼,具備了統計學思維。接下來,就可以進一步學習統計學在資料分析中是如何使用的 — — 《深入淺出統計學》
如果你是零基礎,《深入淺出統計學》這本書籍可以讓你輕鬆愉快的學會,書裡面有通俗易懂的案例,圖文並茂,學習統計學不會那麼枯燥唷。
系列文中出現的吳喜之《統計學·從資料到結論》,也比較推薦!
閱讀建議:
號稱“文組生也能看懂”的統計書。儘管閱讀容易,但所講的知識在資料分析中都是常見且必須掌握的,比如基本的統計量,基本上每個分析專案中都會用到;比如基本的概率分佈,總體與樣本的概念、置信區間、假設檢驗、回歸分析,都是關於資料分析的統計學知識。
第五階段推薦書籍:Python/R語言掌握
我們學習的主題是資料分析,入門推薦《深入淺出Python》,它通過一種獨特的超越語法手冊的方式來説明你學習Python。你將能夠快速掌握Python的基礎知識,然後擴展到持久化、異常處理、Web開發、SQLite等等。你也將學會如何為Android編寫行動應用,這要感謝Python帶給你的強大能力。《深入淺出Python》融合了完備的學習經驗,它將幫助你成為真正的Python程式設計員。
《R 語言實戰》是R語言的入門書籍,更側重實踐,涉及了從資料讀取到各類統計函數的使用。以實際專案講解R的很多常見應用場景,避免了學會一堆語法,卻不知道具體怎麼應用的新手入門常見踩雷。
另外比較推薦《R 錦囊妙計》,每個錦囊皆聚焦一個特定的問題點,並針對解決方案說明討論,闡述其運作的原理。如果您是 R 的初學者,《R 錦囊妙計》將讓您起步更快。如果您對 R 已具備中等程度的理解,本書對於您擴展 R 的學習視野與鞏固記憶將有實質的幫助。經由本書,您將能使分析工作更快速地完成,而且學習更多善用 R 的技巧。--這段來自博客來介紹
閱讀建議:
《深入淺出Python》不適合初學者,而更適合有了一些Python基礎的人閱讀。這本書的作者就是Pandas的作者,因此可以說,這本書就是最佳的Pandas使用指南。英文水準OK的朋友們可以去看看英文原版。如果你想學R的統計應用,R語言這本書很實在,而且命令很豐富,如果你是著眼於R的程式設計,那麼這本書還不是太全面。
第六階段推薦書籍:資料分析軟體應用
聊到資料分析工具,肯定少不了龍頭老大Tableau,《人人都是數據分析師:Tableau應用實戰》這本書對於基礎的初學者來說,是一本很不錯的入門tableau的書,教會大家最方便最快速掌握敏捷分析方法與技術。但tableau最核心的其實還是它做數據分析的思路,而這個是書本內容所無法教會的,唯有不斷磨練才行。
《大拐點》 by Scott Stawski
這本書籍對於瞭解當前資料分析和雲計算行業的發展勢頭十分有幫助。特別值得注意的是,Stawski主要關注原始資料存儲和挖掘系統、如何部署以及在現實世界中的使用情況。
閱讀建議:
《大拐點》不僅是一個理論指南,還揭示了實際的工作系統,並且提到如何把相應模式套用到你的企業或公司。更重要的一點是,你可以從這本書籍中清楚瞭解如何在組織內部署這些工具和平臺。
第七階段推薦書籍:資料視覺化
學習資料庫的操作大家能夠知道如何進行查詢和處理資料,學習業務知識大家能夠有分析體系來衡量業務的發展情況,為了能夠展示我們的分析結果,一個順手的視覺化軟體是必不可少的,FineReport、PowerBI、這些都不錯。感興趣的也可以看看資料視覺化學習路線:
對於初者先學習一個吧,而且這些產品都有自己的檔案,比如FineReport的幫助文檔寫的很詳細,有一步步的學習指導、有關鍵知識視頻講解,最重要的還有分析案例讓大家瞭解的更深入一點,值得花式誇獎一下!
《Information Dashboard Design》
這是一本非常不錯的書籍,裡面包含許多豐富的dashboard示例。在解釋如何創建偉大的儀錶板時,Stephen Few還介紹了資料視覺化和設計理論的原理。Stephen Few的書都非常不錯,但這本書是最容易讀懂的。在這本書中,他指出了儀錶板設計中的常見錯誤,以及避免落入這些陷阱的最佳實踐。
《數據視覺化之美,Beauty Visualization》
這本書籍首先讀了英文版,然後正好又看到中文版,發現確實和很多人吐槽的一樣,翻譯比較差。每一章節都是由不同的人完成(據說是雲集20幾人完成的),每一章都介紹了一種視覺化。很多都是從視覺化的點子開始一直到如何實現,甚至包括一些以前的程式碼。比如“詞雲”發明者的那篇文章。
閱讀建議:
雖然資料視覺化的看起來比資訊圖簡單,但也需要下一番功夫。首先,需要掌握各種圖形的使用場景,推薦書目《Now you see it》,來自商業資料視覺化大師Sephen Few,如果有英文功底,並有志於從事商業分析,建議買來作為長期學習的參考書,書中大部分案例使用Tableau製作。其次,挑選一個合適的工具,如果你的資料量較少,做圖也不頻繁,Excel可能是最佳的選擇。BI視覺化工具比較推薦的是Tableau或者FineReport,FineReport目前是資料視覺化軟體的新起之秀,操作簡潔,只需簡單拖拉拽就能將枯燥的資料,變成精美的圖表。它最核心的兩大功能就是填報和資料展示,但我覺得比較驚豔的一點是,它內置了大量的圖表和視覺化動效,視覺化很豐富,完全沒有印象中做報表那種古板的風格。它能做出格式各樣的dashboard、甚至是視覺化戰情室,一點都不虛。當然,D3、Python、R等程式設計工具不能少,如果希望按照自己的想法構建視覺化,而不受工具能力的限制,那就有必要學習一款程式設計語言。D3專注於資料視覺化,Python和R也都有視覺化的包,可以方便的實現各種類型的視覺化。最後的最後,學會用資料講故事,設計分析儀錶板,推薦的書目為《用資料講故事》,作者是前Google人力分析團隊經理,本書來源自她在全球各地培訓的內容,適合希望從只會做圖表,晉級為能夠用資料講故事的新人。
第八階段推薦書籍:常見的業務分析模型
資料分析有清晰的分析思路/框架很重要,構建分析框架首要的是明確資料分析的目的,我覺得可以按照三個不同的物件來區分:行業環境、企業自身、業務與用戶,對於不同的分析目的應該應用不同的分析方法模型,具體可以看下圖:
書籍這裡不做推薦,初學者可以參考以下三篇文章,可能會讓你對整個邏輯和分析模型有個把握,具體的實例實踐我後面文章會出。
當然,在具體某個環節或者物件上還可以套用一些模型:
RFM模型
RFM模型是衡量客戶價值和客戶創利能力的重要工具和手段。該模型通過一個客戶的近期購買行為、購買的總體頻率以及花了多少錢3項指標來描述該客戶的價值狀況。資料來源的準備只需要四個欄位:客戶名稱、交易日期、交易次數、交易金額。
流量模型
還有一些萬用的原理和模型
金字塔原理/邏輯樹模型
可以利用思維導圖來訓練培養結構化分析思維,將問題層層拆解細分,向下逐步展開等等。
第九階段推薦書籍:業務理解和指標設計
《精益數據分析》
這本書籍延續了新創企業文化中MVP(Most Valuable Product)概念和商業畫布架構,展示了如何利用資料的方式,分析六個產業中(電子商務、SaaS、免費行動應用、媒體網站、使用者生成內容與雙邊市場)的資料,驗證創業者自己的設想、找到真正的客戶、打造能賺錢的產品,以及提升企業知名度。
有趣的地方是,就算新創企業的資料沒有成熟企業來的多,作者認為每種不同的產業仍有必須關注的指標數位。根據這些數位新創公司可以更有效的管理和拓展生意。
閱讀建議:
這本書籍講解了創業公司該如何確定指標體系,如何用資料指導產品和運營,對於業務模式的歸納和業務成長階段的歸納非常到位。後面列舉了大量的場景和案例,幾乎都是基於精益創業,定位非常明確,仔細品讀的話,你一定會收穫很多知識。
第十階段推薦書籍:成長駭客,關注資料驅動增長
《成長駭客》
肖恩·艾理斯是最早提出“成長駭客”概念的理論先驅,該書的精髓在於通過產品快節奏測試和反覆運算,以極低甚至零成本獲取並留存用戶。該書主要講了增長團隊的搭建、 找到產品的“啊哈時刻”,以及使用者的獲取、啟動、留存、變現等內容。其中書的論述重點放在了獲取、啟動、留存、變現這部分。
《矽谷增長駭客實戰筆記》
這本書籍的作者曾在增長駭客之父肖恩•艾理斯麾下擔任增長負責人,用親身經歷為你總結出成長駭客必備的套路、內力和兵法。本書不僅有邏輯清晰的理論體系、乾貨滿滿的實踐心得,還有Pinterest、SoFi、探探、Keep 等中美知名互聯網公司增長專家傾囊相授的一線實戰經驗。
閱讀建議:
這倆本書籍通讀下來,覺得是可以作為增長小白的入門書籍。裡面有一些知識點很是讓人受用,可以做一些詳細知識點筆記,這樣大致會摸清本書脈絡。有關於增長團隊或者是其他的一些增長知識,是可以作為背景拓寬下視野的,比較推薦大家閱讀一番!
我從零基礎入門資料分析,整個入門的過程大致看了以上的這些書籍,這些書可能不需要太多的基礎,只要你i識字,有個高中數學的水準即可。下面幾本也蠻經典的,我就不一一介紹了。
《storying wiht data》、《啤酒與尿布》、《數據之魅》、《網站分析實戰》、《Bad Data Handbook》、《Machine Learning in Action》
在我個人來說,我比較反感把技術性很強的書籍作為入門書籍,這種書基本上翻了兩三頁就作罷了,之前一個朋友推薦一本叫資料採擷導論的,我當時要是認真看了這本,估計已經早早離開資料分析行業了><。另外,業務相關的資料分析不要局限于書本,只要講解真實案例落地的課程或文章等都是可以學習的途徑。祝福各位!
關注數據君的臉書:
我是「數據分析那些事」。常年分享數據分析實用文章,不定期分享好用的職場技能工具。按讚我的臉書,期待您與我的互動!