對於資料分析師來說,我們是必須學習統計學知識的,畢竟天天跟資料打交道,總不能連最基礎的統計學知識都不會吧?
舉個例子,資料分析,你如果連最起碼的置信區間都不懂,你還怎麼處理資料?如果統計學中最基本、核心的思想:用樣本估計總體,你都沒概念,就別說自己會資料分析了。
但多數人在學習統計學知識時會無比頭疼,因為統計學的書籍裡幾乎都是複雜的推理公式,讓人難以理解。其實,對於大部分資料分析師來說,我們並不需要掌握的那麼細。
因此,我整理了一些你需要掌握的統計學知識,把統計學知識展開了說,讓大家大致瞭解有哪幾個模組知識,然後跟著這些模組知識去學習。
一、機率與機率分佈
先要明確,統計學不研究統計,它研究的是不確定性!而不確定性事件唯一的量化標準就是機率,獨立隨機事件沒法透過機率來預判何時發生,但卻可以用機率來描述事件發生的可能性。
這一模組主要掌握:
隨機事件的機率
離散隨機變數
連續隨機變數的機率分佈
二、資料的概括性度量
在資料人的實際工作中,你會經常遇到這種情況:業務人員/老闆拿到一坨資料,丟在你面前,讓你分析。這時,大多數人會不知所措,不知道從哪一步開始整理這些資料。這個時候,就需要透過概括性的度量指標,來幫我們從宏觀上把握資料中的初步資訊。
這一模組主要掌握
集中趨勢的度量
離散程度的度量
分佈形態的度量
三、迴歸分析
迴歸分析,因為它的易懂性,也因為它的實用性,但隨著自己資料分析經驗的積累,對迴歸分析的理解也越來越深,它不是簡單的迴歸模型求解那麼簡單,它更是一種日常工作中解決問題的思路和方法論。
這一模組主要掌握
相關係數
迴歸分析
最小二乘法
顯著性檢驗
四、統計量及其抽樣分佈
抽樣,就是從研究的總體中抽取一部分個體作為我們真正的研究物件,稱為樣本,最後透過樣本的結果來推測總體情況。
這一模組主要掌握
統計量的基本概念
常用統計量
正態分佈
五、引數估計
引數估計,顧名思義就是對引數進行估計,那什麼是引數呢?就是你假設分佈的引數,也就是說你知道某個隨機過程服從什麼分佈,但是不確定他的引數是什麼,那怎麼辦?你取樣,然後透過這些樣本的值,去估計分佈的引數就是引數估計。
這一章節,需要大家掌握幾個核心概念:
引數
點估計
區間估計
原文地址:https://mp.weixin.qq.com/s/JqpZa8Xm1ZZAQ0p9xKrF7w
立即試用FineBI免費版:
https://intl.finebi.com/zh-tw/trial?utm_source=Medium_Banner
※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※
我是「數據分析那些事」。常年分享數據分析乾貨,不定期分享好用的職場技能工具。各位也可以關注我的Facebook,按讚我的臉書並私訊「10」,送你十週入門數據分析電子書唷!期待你與我互動起來~