在數位化潮流的推動下,資料視覺化已成為一門備受歡迎的技能,視覺化圖表能夠幫助企業以清晰、生動的方式傳達資料資訊。其中,盒鬚圖又以其多維度的展示和引人入勝的特點備受關注。
儘管盒鬚圖在資料視覺化領域備受喜愛,但軟妹相信仍然有許多人對盒鬚圖的定義、盒鬚圖怎麼看和盒鬚圖使用時機感到困惑。今天,軟妹將引導大家一起揭開盒狀圖的神祕面紗,詳細解答這些疑問,並深入探討箱型圖的各種應用領域。軟妹將帶領大家學習盒鬚圖製作,同時還會介紹一個強大且免費的盒鬚圖製作工具 — — FineBI。
不論您是初學者還是資料科學大師,都能在這篇文章中發現盒鬚圖的魅力,學會如何將其運用於日常工作。
一、盒鬚圖是什麼?
盒鬚圖(Box Plot),也稱為盒狀圖、箱型圖或箱形圖,是一種統計圖表,用於顯示一組資料的分佈和統計特徵。盒鬚圖通常包括以下幾個元素:
1.中位數(Median):盒鬚圖中的中線代表資料的中位數,即將資料按大小排列後的中間值。
2.四分位數(Quartiles):盒鬚圖分為四個部分,每個部分代表一個四分位數。第一個四分位數(Q1)是資料的25%分位數,第二個四分位數(Q2)是中位數,第三個四分位數(Q3)是75%分位數。
3.箱子(Box):盒鬚圖箱子的上邊框表示Q3,下邊框表示Q1。箱子內部的長度代表資料的中間50%範圍,也稱為四分位距(IQR,Interquartile Range)。
4.鬚(Whiskers):鬚通常延伸出箱子,可表示資料的範圍。鬚的長度通常取決於資料的分佈和極端值(異常值)。
5.異常值(Outliers):盒鬚圖中的資料點,超出了鬚的範圍,通常被視為異常值。
盒鬚圖是一個非常有用的資料視覺化工具,用於比較不同資料集的分佈和離羣值。盒狀圖能夠提供對資料分佈的簡潔摘要,有助於識別資料的集中趨勢、離散度以及是否存在異常值。箱型圖在統計學、資料分析和資料視覺化中經常使用。
二、盒鬚圖怎麼看?
了解了盒鬚圖(又稱盒狀圖)的定義和構成之後,就能根據盒鬚圖的各個組成部分來了解盒鬚圖怎麼看,以及分析盒鬚圖所表達的數據關係了~
箱子的頂端和底端分別代表了資料的上四分位數(Q3)和下四分位數(Q1)。箱子中間的線代表中位數(Q2),即資料的中間值,將箱子一分為二。
箱型圖箱子的外部延伸的線條展示了上下四分位數之外的資料範圍。有時在箱型圖上會出現在鬍鬚末端值以外的個別點。這些代表離羣值,也稱為異常值。
箱形圖的間距不同部分之間的間距表示資料的分散程度和偏斜,同時顯示了異常值。
盒鬚圖的具體資料計算方法如下:
盒鬚圖最大值:是用於區分異常值的最大值,不是資料的最大值。最大值=Q3 + 1.5 * IQR。
盒鬚圖上四分位數:是樣本中所有數值由小到大排列後的第75%的數值。
盒鬚圖中位數:是樣本中所有數值由小到大排列後的第50%的數值,即中間的數值。
盒鬚圖下四分位數:是樣本中所有數值由小到大排列後的第25%的數值。
盒鬚圖最小值:是用於區分異常值的最小值,不是資料的最小值。最小值=Q1–1.5 * IQR。
盒鬚圖四分位間距:是Q3和Q1的差值,即Q3 — Q1,一定程度上反映資料的集中程度,間距越小說明資料越集中。
盒鬚圖異常值:是位於最大和最小值之外的資料點。
總之,透過觀察箱型圖的各個元素,使用者可以瞭解資料的中心趨勢、分佈範圍以及是否存在異常值,以更好地理解資料的特徵和分佈。
三、盒鬚圖使用時機
盒鬚圖(又稱盒狀圖)常用於以下幾個場景:
1.比較不同資料集的分佈:盒鬚圖可以用來比較多個資料集的分佈,以快速識別它們的差異。使用者可以在同一圖表上顯示多個箱子,這樣就能一目瞭然地看出資料集的相對分佈。
2.檢查離羣值:盒鬚圖特別適用於檢查離羣值或異常值。透過觀察鬍鬚之外的個別點,您可以快速識別那些數值明顯偏差標準的資料點。
3.顯示中位數和四分位數:盒鬚圖有助於直覺理解資料的中心趨勢和分佈。中位數、第一四分位數和第三四分位數提供了有關資料集的關鍵統計資訊。
4.觀察資料的分散程度:盒鬚圖的箱子的高度代表了資料的四分位距(IQR),可用於評估資料的變異性。較高的箱子表示資料的分散程度較大。
5.識別偏斜:透過觀察箱子的不同部分之間的間距,可以識別資料是否存在偏斜。不同間距可能表示資料的偏斜程度。
總的來說,盒鬚圖是一種強大的資料視覺化工具,可用於初步探索資料、比較不同資料集、檢查異常值,並提供對資料分佈的直覺理解。箱型圖在統計分析、資料探索和報表中都非常實用。
四、一鍵實現盒鬚圖製作和盒鬚圖分析
現在,我們在前三部分已經瞭解了盒鬚圖的定義、盒鬚圖怎麼看以及箱形圖的應用,接下來,軟妹將帶大家看看如何迅速建立一個專業又美觀的盒鬚圖。這裡軟妹向大家介紹一個能夠一鍵生成盒狀圖的工具 — — 商業智慧軟體FineBI,並帶領大家親自進行盒鬚圖製作。透過盒鬚圖的實體,讓您更好地理解制圖程式。
與常見的辦公軟體如Excel和PPT不同,商業智慧(BI)工具內建資料視覺化功能,使製作專業且精美的資料圖表更加靈活。以FineBI為例,FineBI已經將幾乎所有型別的圖表,包括折線圖、散佈圖、圓餅圖、和直方圖和甘特圖,整合到軟體中,這些圖表可以與其他表格和圖表型別綜合使用。這使得處理複雜資料變得更加容易。BI工具通常是專業的資料分析軟體,適用於對功能要求較高的企業使用者。
FineBI內建的圖表支援多種應用場景,透過資料視覺化呈現,有助於使用者更清晰地理解和分析資料。使用者可以根據自身需求選擇適合的圖表型別,輕鬆製作圖表和進行資料分析~
另外,FineBI非常易於使用,不需要複雜的學習程式。使用者只需簡單的拖拽、點選操作,即可輕鬆地建立資料圖表,實現自主資料分析,而無需依賴IT部門的排程和支援。接下來,軟妹將和大家一起製作兩張盒鬚圖,其中一張不顯示異常值,另一張則顯示異常值~
1.盒鬚圖製作範例一:不顯示異常點
該盒鬚圖展示了不同地區的銷售情況,通過盒型分佈視覺化顯示了連續型銷量資料分佈的情況,可用於分析最高價,最低價等各個價格計算指標。
現在開始和軟妹一起動手製作這張箱型圖吧~
盒鬚圖製作第一步:資料准備
首先,在製作盒鬚圖之前,要先完成數據準備:
FineBI支援多種不同型別的資料連接方式,包括Oracle等資料庫連接和SQL連接等等。
在這裡,我們直接導入Excel表格,能輕鬆處理非即時數據,如下圖所示:
盒鬚圖製作第二步:建立組件
在圖表型別中,選擇“箱形圖”,然後將“省份”維度拖動到橫軸,“銷量”拖動到縱軸,將“城市”拖動到細粒度中,如下圖所示:
盒鬚圖製作第三步:美化組件
將「省份」欄位拖入「顏色」欄,即可成功建立箱型圖,如下圖所示:
同時也可以在顏色設置中選擇推薦配色或自建配色,進行圖表分析自定義。
至此,一張簡單的不顯示異常點的盒鬚圖就製作完成了!
2.盒鬚圖製作範例二:顯示異常點
盒鬚圖製作第一步:建立組件
在圖表型別中,選擇“自訂圖表”。接下來,將“合同型別”欄位拖動到橫軸,然後將“購買的產品”欄位拖動到縱軸兩次。在圖形屬性中,分別設定兩個指標欄位的圖表型別為“箱形圖”和“點”。最終的盒狀圖效果如下圖所示:
盒鬚圖製作第二步:美化組件
將「客戶ID」欄位拖入細粒度中。在圖形屬性中,點選相應的指標欄位,以調整箱型圖點的大小,如下圖所示:
調整縱軸最大值為 60,如下圖所示:
箱形圖效果如下圖所示:
從這張盒鬚圖可以看出,購買合同和長期協定訂單,存在異常點。
五、盒鬚圖(盒狀圖)製作和分析要點
最後,為了幫助大家建立直覺和美觀的箱形圖圖表,軟妹來和大家分享一些製作箱型圖(盒鬚圖)時需要注意的情況,幫大家更好的判斷盒鬚圖使用時機:
1.盒鬚圖不適用於小樣本資料:當資料樣本非常小(通常少於5個資料點)時,箱型圖可能無法提供足夠的資訊來描述資料分佈。在這種情況下,更簡單的描述性統計量如均值和標準差可能更合適。
2.盒鬚圖不適用於非連續資料:箱型圖主要用於展示連續資料的分佈情況,對於分類資料或名義資料,箱形圖的應用有限。
3.盒鬚圖不適用於多模態分佈:如果資料呈現多個峯值或模式,箱型圖可能無法準確反映資料的複雜性。在這種情況下,直方圖或核密度估計圖可能更有幫助。
4.盒鬚圖不適用於資料分佈高度對稱:當資料分佈非常對稱且沒有明顯的偏斜時,箱型圖提供的資訊可能有限。這種情況下,箱形圖可能無法捕捉到分佈的一些特徵。
5.盒鬚圖無法查看詳細資料點:箱型圖提供了關於資料分佈的摘要資訊,但如果需要查看每個資料點的詳細資訊,例如特定值的頻率或精確資料點的位置,箱型圖就不夠了。
6.盒鬚圖不適用於比較不同資料集:箱型圖通常用於單個資料集的視覺化。如果要比較多個資料集之間的分佈差異,其他型別的圖表如散點圖或直方圖可能更適合。
7.盒鬚圖無法顯示趨勢:箱型圖主要用於顯示資料的分散和中位數,但它們無法捕捉資料的趨勢或聯動性。要顯示資料趨勢,其他圖表如折線圖或散點圖更合適。
總之,瞭解何時不宜使用箱型圖可以幫助您選擇適當的視覺化工具來呈現不同型別的資料~
透過本文,軟妹帶領大家深入探討了盒鬚圖在資料視覺化圖表分析中的重要性和應用。探索了如何利用盒鬚圖揭示變數關係、支援趨勢分析,揭示資料背後的故事~
同時,藉助免費盒鬚圖產生器FineBI也能輕鬆實現盒鬚圖製作。無論專業的數據分析師還是初學者,掌握盒鬚圖知識在資料探索與傳達中都是非常重要的~
到此為止,就是本次關於盒鬚圖的全部介紹了。理論知識總是有限的,只有親身實踐才能真正理解資料視覺化的奧妙。現在就立即點擊下方圖片免費試用FineBI,親自動手製作一張盒鬚圖吧!
我是「數據分析那些事」。常年分享數據分析乾貨,不定期分享好用的職場技能工具。各位也可以關注我的Facebook,按讚我的臉書並私訊「10」,送你十週入門數據分析電子書唷!期待你與我互動起來~
文章推薦
◆跟資料打交道的人都得會的這8種資料模型,滿足工作中95%的需求
回顧十週入門數據分析系列文:
關注數據君的臉書:
我是「數據分析那些事」。常年分享數據分析乾貨,不定期分享好用的職場技能工具。按贊我的臉書,會有豐富資料包贈送唷!