學資料分析要懂哪些統計學知識?這份思維導圖務必收好。

--

對於資料分析師來說,我們是必須學習統計學知識的,畢竟天天跟資料打交道,總不能連最基礎的統計學知識都不會吧?

舉個例子,資料分析,你如果連最起碼的置信區間都不懂,你還怎麼處理資料?如果統計學中最基本、核心的思想:用樣本估計總體,你都沒概念,就別說自己會資料分析了。

但多數人在學習統計學知識時會無比頭疼,因為統計學的書籍裡幾乎都是複雜的推理公式,讓人難以理解。其實,對於大部分資料分析師來說,我們並不需要掌握的那麼細。

因此,我整理了一些你需要掌握的統計學知識,把統計學知識展開了說,讓大家大致瞭解有哪幾個模組知識,然後跟著這些模組知識去學習。

一、機率與機率分佈

先要明確,統計學不研究統計,它研究的是不確定性!而不確定性事件唯一的量化標準就是機率,獨立隨機事件沒法透過機率來預判何時發生,但卻可以用機率來描述事件發生的可能性。

這一模組主要掌握:

隨機事件的機率

離散隨機變數

連續隨機變數的機率分佈

二、資料的概括性度量

在資料人的實際工作中,你會經常遇到這種情況:業務人員/老闆拿到一坨資料,丟在你面前,讓你分析。這時,大多數人會不知所措,不知道從哪一步開始整理這些資料。這個時候,就需要透過概括性的度量指標,來幫我們從宏觀上把握資料中的初步資訊。

這一模組主要掌握

集中趨勢的度量

離散程度的度量

分佈形態的度量

三、迴歸分析

迴歸分析,因為它的易懂性,也因為它的實用性,但隨著自己資料分析經驗的積累,對迴歸分析的理解也越來越深,它不是簡單的迴歸模型求解那麼簡單,它更是一種日常工作中解決問題的思路和方法論。

這一模組主要掌握

相關係數

迴歸分析

最小二乘法

顯著性檢驗

四、統計量及其抽樣分佈

抽樣,就是從研究的總體中抽取一部分個體作為我們真正的研究物件,稱為樣本,最後透過樣本的結果來推測總體情況。

這一模組主要掌握

統計量的基本概念

常用統計量

正態分佈

五、引數估計

引數估計,顧名思義就是對引數進行估計,那什麼是引數呢?就是你假設分佈的引數,也就是說你知道某個隨機過程服從什麼分佈,但是不確定他的引數是什麼,那怎麼辦?你取樣,然後透過這些樣本的值,去估計分佈的引數就是引數估計。

這一章節,需要大家掌握幾個核心概念:

引數

點估計

區間估計

原文地址:https://mp.weixin.qq.com/s/JqpZa8Xm1ZZAQ0p9xKrF7w

立即試用FineBI免費版:

https://intl.finebi.com/zh-tw/trial?utm_source=Medium_Banner

※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※

我是「數據分析那些事」。常年分享數據分析乾貨,不定期分享好用的職場技能工具。各位也可以關注我的Facebook,按讚我的臉書並私訊「10」,送你十週入門數據分析電子書唷!期待你與我互動起來~

文章推薦

餅圖變形記,肝了3000字,收藏就是學會!

MySQL必須掌握4種語言!

太實用了!4種方法教你輕鬆製作互動式儀表板!

跟資料打交道的人都得會的這8種資料模型,滿足工作中95%的需求

妙呀!一行Python程式碼

--

--

數據分析那些事
數據分析那些事

Written by 數據分析那些事

這是一個專注於數據分析職場的內容部落格,聚焦一批數據分析愛好者,在這裡,我會分享數據分析相關知識點推送、(工具/書籍)等推薦、職場心得、熱點資訊剖析以及資源大盤點,希望同樣熱愛數據的我們一同進步! 臉書會有更多互動喔:https://www.facebook.com/shujvfenxi/

No responses yet