導讀:大資料時代,資料分析已經是每個行業成果的必經之路了,更是職場核心競爭力之一,它可以幫助我們找出真實世界的規律,輔助我們進行決策和驗證。透過資料表象,看到背後的本質,發現問題,給出解決方案。
例如,分析整體銷售的業績,面對一堆雜亂無章的資料來源表時,要讓銷售人員看到自己的業績情況,發現不足,及時改進。我們就需要展示每個銷售人員的業績,不僅能和歷史業績對比,還能和其它銷售業績進行橫向、縱向的比較。
這時,我們若熟練掌握Excel使用以及函式,幾分鐘就能完成,而別人也許倒騰1天的工作量哦。
可見,Excel的使用對於資料分析的重要性不言而喻!咱們今天來簡單的梳理一下資料分析必備 — — Excel中常用的統計函式。本文所有公式需均結合例項,講為輔,練為主,基礎紮實夥伴可以直接跳過,其他夥伴可以當做回顧和複習。
01、計算公式
在Excel我們經常會遇到計算,計算公式其實很簡單,‘=’後面加對應的函式,並取函式的引數就可以了,以下圖的資料為例,我們來計算每件商品的銷售利潤,我們知道,銷售利潤=(售出單價-成本價)*銷售數量,那我們在Excel中怎麼列計算公式呢?其實很簡單,把對應的值進行轉換就行了,操作看下圖:
銷售利潤=(D2-B2)*C2。有5個常用的運算子:加(+),減(-),乘(*),除(/),冪(^),運算子是需要前後有單元格引用的,單個單元格不生效。
02、描述性指標
我們在對一組資料進行觀察的時候大多用幾個指標來展示整體資料情況。
集中程度的指標有最大值、最小值、平均值、中位數、眾數等,在Excel中也存在對應的函式。
l 最大值:取一組資料的最大值,公式為= MAX(number1,number2)
l 最小值:取一組資料的最小值,公式為= MIN(number1,number2)
l 中位數:取一組資料的中位數,公式為= MEDIAN(number1,number2)
l 平均值:取一組資料的算術平均值,公式為= AVERAGE(number1,number2)
l 眾數:取一組資料的眾數,公式為= MODE(number1,number2)
03、箱線圖
離散程度的指標有極差、四分位間距、方差與標準差、變異係數,這些資料還可以用一個更直觀的箱線圖表示出來,以銷售數量為例展示:
再來解釋一下箱線圖的指標的含義,看下圖
繪圖方法:
1、 選中需要繪圖的陣列,這裡選中的是C2:C10;
2、 點選【插入】,選擇圖形型別;
3、 找到箱線圖,繪製完成,其他圖也是如此。
04、IF函式
IF函式是常見的比較函式,通常會用在值域轉換上,來看IF函式的公式解析。
例:在銷售數量中大於20的評判為“優“,小於20的評判為”-“,公式為=IF(C2>20,”優”,”-”)
上圖是二分類的判斷,當條件有多個的時候就需要做嵌套了,巢狀的if詳細解析:
IF(條件1,真值,IF(條件2,真值,IF(…IF(條件n,真值,假值))))
例:銷售數量大於30的為“優”,20–30的為“良”,10–20的為“中”,小於10 的為“-”,公式為=IF(C2>30,”優”,IF(C2>20,”良”,IF(C2>10,”中”,”-”)))
05、VLOOUP 函式
VLOOKUP是Excel常用的主要函式之一,我們做統計分析的時候資料往往分佈在不同的表中,我們要把這些欄位聯合在一起就需要用VLOOKUP函式。
例:在文具店的2張銷售資料表中,需要按照各個商品進行整合。
1、 分別開啟表1和表2;
2、在表2的成本價這列的單元格中輸入公式;=VLOOKUP(@A:A,[表1.xlsx]Sheet3!$A:$B,2,0),第1個引數直接選中A列需要查詢的值,第2個引數選中表1中我們需要查詢範圍資料區域A、B2列,第3個引數輸入我們要查詢列數,這裡是第2列,第4個引數,輸入0(0為精確匹配,1位模糊匹配)。引數意思是VLOOKUP(查詢值,查詢範圍,查詢列數,精確匹配或者近似匹配)。
3、 填充至整個表格。
VLOOKUP函式在WPS和Excel裡都是可以使用的,學完別忘了要多上手練習!
06、資料透視表
資料透視表,可以說是EXCEL的核心武器了。
理論上講,資料透視表是excel提供的一種互動式的強大資料分析和彙總工具。可以總結為:資料透視表是可以把一個明細表進行分類彙總,而且可以隨意改變彙總模式的一種工具。
明細表?分類彙總?工具?云云…….總之,資料透視表的用途如果細數會有很多,但最基本、最常用的是“分類彙總”,所以當我們需要對一個流水賬式的明細表進行分類彙總時,就需要使用資料透視表。聽起來還是有點抽象,我們還是看實際的資料操作比較直觀。
下面我們結合一組資料來一探究竟:
源資料是2020年3月-9月的銷售資料,每一行代表一筆交易,資料涉及7個關鍵欄位“訂單序號”、“日期”、“省份”、“城市”、“銷售額“、”銷售數量”、“客單價”。如果我們想知道每個月,每個省份銷售額是多少,該怎麼辦呢?
我們先選中所有列,在插入模組選中“資料透視表”。
接著就是選擇資料透視表存放的區域,在嚮導的第一步一般是預設選項,不需要設定,直接點確定即可。預設是新工作表,大家在實際操作中也可選擇現有工作表的區域。
會自動新建一個工作表,且在工作表中會有一個數據透視表空白區域,其他的什麼都沒有,需要我們安排資料具體的位置。大家注意右側的“資料透視表字段”區域,這裡是透視表的核心控制元件。但是我們需要“計算每個月,每個省份的銷售額”,那就是按照“月”和“省份”來進行分組了。
以哪個欄位分組,就將哪個欄位拖到行或者列。
新增資料透視表專案
·把日期拖動到行標籤;
·把省份放在列標籤;
像下面這樣:
左側資料透視表結構區域隨著我們的拖動發生了變化,剛才我們把日期拖動到行,把省份移動到列,果然,資料透視表佈局和我們操作一樣的:
資料透視表分組邏輯為判斷是否唯一,如果唯一則單獨分為一行(或一列),想要把行標籤的日期格式變成月的維度。
需要我們選擇上面的選單,選擇“組選擇”:
點選“組選擇”之後會出現如下選項卡:
起始時間預設是源資料中最早和最晚時間,這裡不用更改,我們想以月的維度建立分組,所以選擇“月”。
這透視表分組,行是月份,列是省份。
我們要計算涉及到的核心欄位是銷售額,在已經分好組的情況下,只需要把銷售額欄位拖到拖動到數值區域:
一個數據透視表的雛形已展現在我們的面前:
大家注意,我們剛才把銷售額拖動到數值區域,一般情況下,預設是“計數項”,資料透視表現在顯示的每個值,指的是訂單數量,如果要計算銷售額,要再點選“銷售額”欄位。
進入“值欄位設定”。
這裡的“計算型別”選擇“求和”,我們就得到各月各省的銷售額總和,“平均值”就是各月各省銷售額平均值,最大值、最小值依然。(我們最常用的也就是這幾個)
最後:各省、各月銷售額一目瞭然。
但是,在製作資料透視表,需要注意以下幾點:
1、空欄位名包括空列,無法制作資料透視表;
2 、相同的欄位名,會自動新增序號,以示區別 ;
3 、欄位所在行有合併單元格,等同於空欄位,也無法建立資料透視表;
4 、如果有空行,會當成空值處理。
本次的Excel基礎知識就介紹到這裡,雖然沒有梳理的太深,但已經涉及了大部分資料工作中常用的操作和公式。其實,Excel最重要就是資料透視表的使用,但是現在wps的便捷,基礎的資料透視的使用還是很簡單的。
※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※
我是「數據分析那些事」。常年分享數據分析乾貨,不定期分享好用的職場技能工具。各位也可以關注我的Facebook,按讚我的臉書並私訊「10」,送你十週入門數據分析電子書唷!期待你與我互動起來~