牢記這五個原則,幫助你完成滿分資料視覺化!

--

每當我對資料進行視覺化時,不管是靜態圖、動態圖,還是報告、部落格中的一部分,甚至是 Twitter的配圖,都會遵循以下五個原則,今天和大家分享~

1.展示資料。
2.減少混亂。
3.圖文結合。
4.避免使用意麵圖。
5.從灰色開始。

展示資料和減少混亂意味著減少多餘的網格線、標記和陰影,這些都會干擾實際資料。

有力的標題、更好的標籤和有用的註釋將使圖表與其周圍的文字相結合。

當圖表有許多資料系列時, 可以策略性地使用顏色突出顯示感興趣的系列,或者將一個密集的圖表拆分成多個小圖表。

總之,這五個原則會提醒我關注受眾的需求,以及如何用視覺化的資料講故事。

原則1:展示資料

讀者只有看到你的資料,才能理解你的重點、觀點或故事。這並不意味著你要展示所有的資料,但你要突出顯示那些支撐觀點的資料。

作為圖表的建立者,我們面臨的挑戰是要呈現多少資料,以及呈現的最佳方式。

這張美國的點密度圖,使用了自2010年起,美國十年一次的人口普查資料,每一個點代表一個人,這是全國3.08億居民在人口普查區(一個人口普查區相當於一個街區)的分佈情況。注 意,這張圖除了資料什麼都沒有,沒有州界,沒有道路,沒有城市標誌,也沒有湖泊和河流的標記。但我們仍然能看出這是美國,因為人們往往生活在邊境和沿海地區,這些資料痕跡勾勒出了整個國家的形狀。

格式塔的相似原理幫助我們看出美國的人群聚居情況。圖片來源:版權所有,2013年,韋爾登庫柏 公共服務中心,Rector and Visitors of the University of Virginia1(弗吉尼亞大學下屬的一家出版社),達斯汀·A.科博爾(Dustin A.Cable) 製作

這並不意味著我們必須一直顯示所有的資料。有時圖表顯示的資料太多,很難看出哪些資料更重要。比如這兩張折線圖,都顯示了世界上50個國家的平均受教育年限。

在左邊的圖表中,每個國家都用不同顏色的折線表示。這導致整張圖表非常混亂,無法看出任何一個國家的趨勢。

而在右邊的圖表中,突出顯示了六個重點關注的國家,其他國家全部被設定為灰色,把它們當成背景資訊。

這樣,讀者一眼就能看出我們想要強調的國家。這不是說我們要顯示最少的資料,而是說要顯示最重要的資料。

只突顯幾個國家(右圖),這樣圖表更容易閱讀

原則2:減少混亂

使用不必要的視覺元素會分散讀者的注意力,並使頁面變得混亂。

有很多導致圖表混亂的陷阱需要避開。有一些基本元素,比如太粗的刻度線和網格線,幾乎都可以直接刪除。

有些圖表會使用資料標記(如正方形、圓形和三角形)來區分序列,但當標記重疊時,它們會讓圖表看上去亂糟糟的。

當使用簡單的、純色的圖表效果也很好時,千萬不要做紋理或漸變填充。當使用不必要的3D(立體)效果時,會使資料失真。

還有一些圖表包含太多的文字和標籤,使得整個空間變得混亂而擁擠。

就拿這張美國和德國的平均受教育年限的三維柱狀圖來說。

你之前應該也見過這種3D圖表 — — 分散注意力、難以閱讀及資料失真

如果你認為沒有人會設計這麼奇怪的圖表,那麼你就錯了。

這是直接複製過來的圖表,包括它的漸變樣式。三維的柱形和閃爍的條紋,不匹配的資料和軸標籤,用大量的小數表明資料的精確度,但實際上並沒有這種效果 — — 所有這些混在一起形成了一張很難閱讀的圖表,老實地說,看起來很不舒服。

同時,三維圖形會讓資料失真。出現這種失真,是因為使用了不必要的三維透視效果。透過擯棄這些無關的、分散注意力的元素來簡化圖表,可以讓你的觀點更加清晰、易懂。

雖然我們對感知,以及眼睛和大腦如何工作的理解大多根植於科學研究,但決定使用什麼視 覺效果往往是主觀的。比如使用哪種圖表、在哪裡放置標籤和註釋、使用什麼顏色和字型等。

使用基礎的柱狀圖就能消除3D效果導致的混亂和失真,因此圖表更容易閱讀和理解

在有些情況下,使用某種圖表客觀上就是錯誤的,但在大多數情況下,需要靠你的主觀判斷。隨著你建立和閱讀視覺化圖表的數量越來越多,你將拓寬視野,提高審美能力,並找到藝 術和科學之間的平衡。

原則3:圖文結合

儘管我們主要關注建立視覺化圖表的元素,比如條形、點或折線,但對圖表的文字說明同樣重要。我們常常將文字和註釋視為事後才思考的內容,但這些元素可以幫助讀者來理解圖表所包含的內容,以及圖表本身。

《紐約時報》的資料編輯阿曼達·考克斯(Amanda Cox)曾經說過,“註釋部分是最重要的……否則就相當於說‘都在這兒,你自己去搞明白’。”

為圖表新增正確的註釋,從幫助讀者理解的角度來說,至關重要。

刪除圖例、建立有吸引力的標題和新增一些細節。

1.儘可能去掉圖例,直接標註資料

將標籤直接放置在圖表上,讀者能更輕鬆地找到對應的資料

2.把標題寫得像報紙的標題一樣

好的標題需要能抓住圖表的要點,告訴讀者從中可以得出什麼結論。我把這些稱為“有力的標 題”或“報紙式標題”。

這張來自皮尤研究中心的圖表的標題準確地告訴你應該從中學習什麼

3.添加註釋

一旦圖表製作完成,標題確定下來後,不妨問問自己,如果再新增一些文字說明,會更有幫助嗎?

有時資料裡有峰值或谷值、離散值或波動值需要解釋。在圖表中新增細節說明,有助於大 家推匯出你的論點或關鍵點。如果使用的是非標準圖表,則還要解釋如何閱讀它。

右圖中簡短的說明解釋了資料的一些基本特徵

原則4:避免使用意麵圖

意麵圖(Spaghetti Chart)是製造業裡的一個術語,這裡作者用來泛指那種容納了大量資料的圖表。

很明顯,當某張圖表包含太多的資訊時 — — 折線圖看起來就像一堆義大利麵條,還有幾十種顏色和圖示的地圖,或者一個接一個的條形佈滿整個頁面。當一張圖表中包含大量的資料時,這的確是一個挑戰,但我們不需要將所有資料都放到一張圖表中。

小型序列圖(small multiples)的兩個示例。左圖來自Zeit Online,顯示了德國過去140年的平均氣溫。右圖來自疾病控制和預防中心,顯示了面部毛髮如何影響呼吸器的安裝。格式塔的連線原理可以幫助我們追蹤圖中的變化

我們可以將一張圖表分解成多張圖表。這被稱為網格圖或面板圖,也叫格柵圖,或小型序列圖。這些較小的圖表使用相同的比例、座標軸和範圍,但將資料分佈在多張圖表上。換句話說,不要把所有的資料都放在一張圖表中,而是在基礎資料上建立多個更小的版本。

小型序列圖不是一種新的或革命性的資料表達方式。1878年,攝影師埃德維德·穆布里 奇(Eadweard Muybridge)要確定一匹馬在飛奔時是否完全騰空。穆布里奇開發了一種技術來 拍攝一匹疾馳的馬,它可以拍攝一系列快速動作的照片(我們現在稱之為定格)。他的照片證 明,馬在飛奔時確實完全離開了地面。影象序列,也給人一種動態感,這是小型序列圖早期的例子。

攝影師埃德維德·穆布里奇早在1878年就採用了小型序列圖的方式來確定馬在飛奔時是否完全騰空

小型序列圖至少有三個優點。

首先,一旦讀者知道如何閱讀其中的一張圖表,就會閱讀其 他圖表了。

其次,你可以顯示大量的資訊,而不會讓讀者感到困惑。

第三,讀者可以跨多個變數進行比較。

《衛報》(Guardian)的這個例子顯示,2016年英國脫歐決議案在六個不同人口 統計學變數上的投票結果。橫軸保持不變,可以很容易看到每個人口統計指標的關係方向。

《衛報》的多張小型散點圖顯示了投票選擇與六個人口統計學變數之間的關係。格式塔的相似原理 讓我們很容易看到每張散點圖中的兩類資料

但這種序列圖也存在一些缺陷,如果不加以避免,圖表會很混亂。

首先,圖表應該按邏輯順序排列。不要讓讀者到處瀏覽整個頁面,而是應該使用直觀的排序方式,比如地理位置或字母順序。

其次,圖表應該使用相同的佈局、大小、字型和顏色。請記住,我們正在將一張圖表分 解為多張圖表,因此它應該看起來像一張圖表被複制了多次。縱軸和橫軸也許會改變,但你不 能用藍點在一張圖表中代表“否”,而在另一張圖表中代表“是”。

第三,序列圖應該相對容閱讀。你不必要求讀者放大,並詳細解讀圖表中的所有細節,你的目的是給他們一種整體模式。這些圖表的尺寸很小,因此,包含註釋和標籤,或重複冗長的軸標籤和資料標記,都會讓讀者不知所措。

原則5:從灰色開始

最後我們用一個實用的技巧來結束今天的文章,這是建立清晰、易懂的視覺化效果的一個簡單步驟:從灰色開始。

無論何時繪製圖表,都從全灰色元素開始。這樣,會迫使你在使用顏色、標籤和其他元素時更有目的性和策略性。

我們以一張簡單的平均受教育年限的圖表為例,這次只顯示10個國家。有了顏色和標籤 (左上角的圖表),我可以把這張圖表放到我的報告或講義中,稍做加工,再新增一個有吸引 力的標題,讀者就可以知道哪些標籤對應於哪些折線。但是,如果把所有的折線都變成灰色的 (右上角的圖表),讀者就無法完成同樣的任務,因為不知道哪條折線對應於哪個國家。

將所有資料先全部設定為灰色,這會迫使你思考你的目的,以及你到底想要將讀者的注意力引向何處

現在我可以有目的地調整這張圖表。

我可以新增顏色,改變線條的粗細,以便更好地突 出顯示想要強調的資訊,比如其中的兩個國家。

左下角的圖表,把所有的標籤都放在圖表上, 而右下角的圖表,只是直接標明兩個國家,可以明顯地看出,右下角的圖表能更有效地傳遞資訊。

在最后給大家推薦一個我最常用的BI軟體,在使用過程中FineBI能夠提供超多參考配色,大家感興趣的話可以體驗看看:

文章來源:Python數據之道
原文連結:https://mp.weixin.qq.com/s/RZWJ0wTxsqy2DNuqz3VXBA

※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※

我是「數據分析那些事」。常年分享數據分析乾貨,不定期分享好用的職場技能工具。各位也可以關注我的Facebook,按讚我的臉書並私訊「10」,送你十週入門數據分析電子書唷!期待你與我互動起來~

文章推薦

餅圖變形記,肝了3000字,收藏就是學會!

MySQL必須掌握4種語言!

太實用了!4種方法教你輕鬆製作互動式儀表板!

跟資料打交道的人都得會的這8種資料模型,滿足工作中95%的需求

妙呀!一行Python程式碼

回顧十週入門數據分析系列文:

關注數據君的臉書:

我是「數據分析那些事」。常年分享數據分析乾貨,不定期分享好用的職場技能工具。按贊我的臉書,會有豐富資料包贈送唷!

--

--

數據分析那些事
數據分析那些事

Written by 數據分析那些事

這是一個專注於數據分析職場的內容部落格,聚焦一批數據分析愛好者,在這裡,我會分享數據分析相關知識點推送、(工具/書籍)等推薦、職場心得、熱點資訊剖析以及資源大盤點,希望同樣熱愛數據的我們一同進步! 臉書會有更多互動喔:https://www.facebook.com/shujvfenxi/

No responses yet