5000字看完資料視覺化的歷史

--

視覺化發展史與測量、繪畫、人類現代文明的啟蒙和科技的發展一脈相承。在地圖、科學與工程製圖、統計圖表中,視覺化理念與技術已經應用和發展了數百年。

17世紀之前:圖表萌芽

16世紀時,人類已經掌握了精確的觀測技術和裝置,也採用手工方式製作視覺化作品。視覺化的萌芽出自幾何圖表和地圖生成,其目的是展示一些重要的資訊,見圖1和圖2。

圖1 公元前6200年的人類地圖。
圖2 人類歷史上第一幅城市交通圖,呈現了羅馬城的交通狀況。

1600–1699年:物理測量

17世紀最重要的科學進展是對物理基本量(時間、距離和空間)的測量裝置與理論的完善,它們被廣泛用於航空、測繪、製圖、瀏覽和國土勘探等。同時,製圖學理論與實踐也隨著分析幾何、測量誤差、機率論、人口統計和政治版圖的發展而迅速成長。17世紀末,甚至產生了基於真實測量資料的視覺化方法(見圖3和4)。從這時起,人類開始了視覺化思考的新模式。

圖3 誕生於1626年表達太陽黑子隨時間變化的圖。在一個檢視上同時視覺化多個小圖序列,是現代視覺化技術中稱為郵票圖表法(Small Multiples)[Tufte1992]的雛形。
圖4 1686年繪製的歷史上第一幅天氣圖,顯示了地球的主流風場分佈。這也是向量場視覺化的鼻祖。

1700–1799年:圖形符號

進入18世紀,繪圖師不再滿足於在地圖上展現幾何資訊,發明了新的圖形化形式(等值線、輪廓線)和其他物理資訊的概念圖(地理、經濟、醫學),見圖5和圖6。隨著統計理論、實驗數據分析的發展,抽象圖和函式圖被廣泛發明。

圖5 左:1701年地球等磁線視覺化;右:1758年Lambert完成的三維金字塔顏色系統視覺化。
圖6 1765年Joseph Priestley發明的時間線圖。採用了單個線段表現某個人的一生,同時比較了公元前1200年到公元1750年間2000個著名人物的生平。這幅作品直接激發了柱狀圖的誕生。

18世紀是統計圖形學的繁榮時期,其奠基人William Playfair發明了折線圖、柱狀圖、顯示區域性與整體關係的餅狀圖和圓圖等今天最常用的統計圖表(見圖7和圖8)。

圖7 William Playfair作品:丹麥和挪威1700–1780年間的貿易進出口序列圖 [Tufte1990]。
圖8 左:世界上第一幅餅圖,顯示了1789年土耳其帝國在亞洲、歐洲和非洲的疆土比例;右:德國物理學家Lambert用於表達水的蒸發和時間之間的關係的線圖視覺化。

1800–1900年:資料圖形

隨著工藝設計的完善,19世紀上半葉,統計圖形、概念圖等迅猛爆發,此時人們已經掌握了整套統計資料視覺化工具,包括柱狀圖、餅圖、直方圖、折線圖、時間線、輪廓線等。關於社會、地理、醫學和經濟的統計資料越來越多,將國家的統計資料和其可視表達放在地圖上,產生了概念製圖的新思維,其作用開始體現在政府規劃和營運中。採用統計圖表來輔助思考的誕生同時衍生了視覺化思考的新方式:圖表用於表達數學證明和函式;列線圖用於輔助計算;各類視覺化顯示用於表達資料的趨勢和分佈,便於交流、獲取和視覺化觀察。圖9至圖14展示了部分例項。

圖9 1837年人類歷史上第一幅流圖,用可變寬度的線段顯示了交通運輸的軌跡和乘客數量。

19世紀下半葉,系統地構建視覺化方法的條件日漸成熟,進入了統計圖形學的黃金時期。值得一提的是法國人Charles Joseph Minard,他是將視覺化應用於工程和統計的先驅者。其最著名的工作是1869年釋出的描繪1812–1813年拿破崙進軍莫斯科大敗而歸的歷史事件的流圖,這幅圖如實地呈現了軍隊的位置和行軍方向、軍隊匯聚、分散和重聚的地點與時間、軍隊減員的過程、撤退時低溫造成的減員等資訊,見圖10。

圖10 1812–1813年拿破崙進軍莫斯科的歷史事件的流圖視覺化 [Tufte2006],被譽為有史以來最好的統計視覺化。
圖11 左:1861年的現代天氣圖,採用圖示展現了各地的氣壓變化。這幅圖直接導致人類發現了低壓區域中風場的反氣旋行動;右:1884年的圖示視覺化,其圖示尺寸正比於某個數字。這種視覺化方法經常見於現代媒體的經濟、體育、統計等報道。
圖12 採用填充長方形顯示兩個變數及乘積。圖示中長方形的面積編碼了法國巴黎的外國人數目。
圖13 由近代護理事業的創始人南丁格爾創作的堆疊餅圖(1857年,也稱玫瑰圖)。
圖14 1888年的火車時刻表,精確地顯示了巴黎往返法國各地的火車轉接時刻 [Tufte1997]。此方法沿用至今。

1900–1949年:現代啟蒙

20世紀上半葉對於視覺化而言是一個缺乏創新的時期,但是視覺化隨著統計圖形的主流化開始面向政府、商業和科學走向應用普及(見圖15和16),人們第一次意識到圖形顯示的方式能為航空、物理、天文和生物等科學與工程領域提供新的洞察和發現機會。多維資料視覺化和心理學的介入成為這個時期的重要特點。

圖15 左:1904年關於太陽黑子隨時間擾動的蝴蝶圖驗證了太陽黑子的週期性;右:1920年發明的路徑圖顯示了結構方程系統中變數形成的網路。
圖16 1933年Henry Beck設計的倫敦地鐵圖成為地鐵路線的標準視覺化方法,沿用至今。

1950–1974年:多維資訊的可視編碼

1967年,法國人Jacques Bertin出版了Semiology of Graphics(《圖形符號學》)一書[Bertin1983],確定了構成圖形的基本要素,並且描述了一種關於圖形設計的框架。這套理論奠定了資訊視覺化的理論基石。隨著個人計算機的普及,人們逐漸開始採用計算機程式設計生成視覺化。圖17至圖19展示了這個時期的一些代表性工作。

圖17 1957年發明的圓形圖示,採用線段及其朝向編碼多維資料。
圖18 1967年法國人Jacques Bertin提出的完備的圖形符號和表示理論。左:視覺通道;右:針對點(Point)、線(Line)和區域(Area)資料採用不同視覺通道的圖形符號表示方案。
圖19 1973年Herman Chernoff發明的表達多變數資料的臉譜編碼。

1975–1987年:多維統計圖形

20世紀70年代以後,桌面作業系統、計算機圖形學、圖形顯示裝置、人機互動等技術的發展激發了人們程式設計實現互動式視覺化的熱情。處理範圍從簡單的統計資料擴充套件為更復雜的網路、層次、資料庫、文字等非結構化與高維資料。與此同時,高效能計算、平行計算的理論與產品正處於研製階段,催生了面向科學與工程的大規模計算方法。資料密集型計算開始走上歷史舞臺,也造就了對於數據分析和呈現的更高需求。

1977年,美國著名統計學家John Tukey發表了“探索式數據分析”的基本框架,它的重點並不是視覺化的效果,而是將視覺化引入統計分析,促進對資料的深入理解。1982年,Edward Tufte出版了The Visual Display of Quantitative Information一書 [Tufte1992],構建了關於資訊的二維圖形顯示的理論,強調有用資訊密度的最大化問題。這些理論會同Jacques Bertin的圖形符號學,逐漸推動資訊視覺化發展成一門學科 [Cleveland1993][Cleveland1994]。圖20至圖24展現了部分具有里程碑意義的資訊視覺化方法。

圖20 左:1975年統計圖形學家發明的增強散點圖表達(三條行動統計均線)。右:John Hartigan發明的散點圖矩陣。
圖21 1985年發明的表達高維資料的平行座標。
圖22 1971年發明的表達多變數資料的星形圖。
圖23 1981年發明的魚眼方法,模擬魚眼視覺效果對重要細節提供專注,對其他區域則予以簡化。
圖24 1981年John Hartigan等發明的馬賽克圖,用以表達多維類別型資料。

1987–2004年:互動視覺化

1986年10月,美國國家科學基金會主辦了一次名為“圖形學、影象處理及工作站專題討論”的研討會,旨在為從事科學計算工作的研究機構提出方向性建議。會議將計算機圖形學和影象方法應用於計算科學的學科稱為“科學計算之中的視覺化”(Visualization in Scientific Computing,簡稱ViSC)。1987年2月,美國國家科學基金會召開了首次有關科學視覺化的會議,召集了眾多來自學術界、工業界以及政府部門的研究人員,會議報告正式命名並定義了科學視覺化(Scientific Visualization),認為視覺化有助於統一計算機圖形學、影象處理、計算機視覺、計算機輔助設計、訊號處理和人機介面中的相關問題,具有培育和促進科學突破和工程實踐的潛力。同年,在圖形學頂級會議ACM SIGGRAPH上,來自美國GE公司的William Lorensen和Harvey Cline發表了“行動立方體法”(Marching Cubes)一文,開創了科學視覺化的熱潮。這篇論文是有史以來ACM SIGGRAPH會議被引用最高的論文。1989年,國際期刊Computer發表了一期關於科學計算中的視覺化研究的專刊[Nielson1989]。

20世紀70年代以後,放射影像從X-射線發展到計算機斷層掃描(CT)和核磁共振影象(MRI)技術。1989年,美國國家醫學圖書館(NLM)實施視覺化人體計劃。科羅拉多大學醫學院將一具男性和一具女性屍體從頭到腳做 CT掃描和核磁共振掃描,男的間距1毫米,共1878 個斷面;女的間距0.33毫米,共5189個斷面,然後將屍體填充藍色乳膠並裹以明膠後冰凍至零下80攝氏度,再以同樣的間距對屍體作組織切片的數碼相機攝影,如圖25左圖所示,解析度為2048×1216,所得資料共56GB。這兩套資料集極大地促進了三維醫學視覺化的發展,成為視覺化標杆式的應用範例。

圖25 左:美國視覺化人體資料切片之一;右:採用直接體視覺化技術繪製鱷魚木乃伊CT資料。

1990年,IEEE舉辦了首屆IEEE Visualization Conference,彙集了一個由物理、化學、計算、生物醫學、圖形學、影象處理等交叉學科領域研究人員組成的學術群體。2012年,為突出科學視覺化的內涵,會議更名為IEEE Conference on Scientific Visualization。自18世紀後期統計圖形學誕生後,針對抽象資訊的視覺表達手段仍然在不斷髮展,被用於揭示資料及其他隱匿模式的奧秘。與此同時,數位化的非幾何的抽象資料如金融交易、社交網路、文字資料等大量湧現,促生了多維、時變、非結構化資訊的視覺化需求。圖26顯示了面向層次結構資料的樹圖視覺化結果;圖27展示了美國施樂公司發明的表格透鏡技術,它允許人們以凸透鏡的方式來獲得對大尺度表格焦點+上下文的體驗。

圖26 1991年Ben Shneideman教授發明的樹圖,用級聯巢狀的平面化樹狀結構表達層次結構。
圖27 1994年美國施樂公司的研究人員發明的表格透鏡技術。

20世紀80年代末,視窗系統的問世使得人們能夠直接與資訊進行互動。1988年,著名的統計圖形學學者William Cleverland在其著作Dynamic Graphics for Statistics中詳細總結了面向多變數統計資料的動態視覺化手段。1989年,Card、Mackinlay和Robertson等人採用“Information Visualization”(資訊視覺化)命名這個學科,其研究思想和範疇是對統計圖形學的昇華。從1995年開始,出現了單獨面向資訊視覺化的會議 — — IEEE Information Visualization會議,它以研討會(Symposium)的形式附屬於IEEE Visualization會議。2007年,研討會改名為IEEE Conference on Information Visualization。

2004年至今:可視分析學

進入21世紀,現有的視覺化技術已難以應對海量、高維、多源和動態資料的分析挑戰,需要綜合視覺化、圖形學、資料探勘理論與方法,研究新的理論模型、新的視覺化方法和新的使用者互動手段,輔助使用者從大尺度、複雜、矛盾甚至不完整的資料中快速挖掘有用的資訊,以便做出有效決策。這門新興的學科稱為可視分析學。可視分析學是一門新興的學科,其核心理論基礎和研究方法尚處於探索階段。從2004年起,研究界和工業界都沿著面向實際資料庫、基於視覺化的分析推理與決策、解決實際問題等方向發展。

例如:

圖28 展示了一個數據可視分析軟體Data Science Studio的介面
圖29 視覺化分析軟體Palantir(http://www.palantir.com)

圖29展示了視覺化分析軟體Palantir(http://www.palantir.com),它允許使用者連線多個網路資料庫,互動地分析資料,建立人、事件、地點之間的關聯,解決複雜的問題,發現隱藏的規律。

2005年,美國國家科學基金會聯合美國國家衛生研究所召集了一個新的專題小組,討論視覺化研究的現狀和麵臨的挑戰,並於2006年釋出了一個專題報告來描述大規模資料視覺化所面臨的挑戰。與此同時,2004年美國國土安全部為了應對恐怖襲擊,成立了國家可視分析中心,2005年釋出的“可視分析的研究和發展規劃”報告全面闡述了可視分析的挑戰。2006年,IEEE開設了國際會議(IEEE Symposium on Visual Analytics Science and Technology)。2012年更名為IEEE Conference on Visual Analytics Science and Technology。同時,歐盟歐洲視覺化年會EuroVis從2010年起,專門舉辦可視分析研討會EuroVAST。

文章來源:可以叫我才哥
原文連結:https://mp.weixin.qq.com/s/39JCRsoGsjY1-dwpGB8Anw

※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※

我是「數據分析那些事」。常年分享數據分析乾貨,不定期分享好用的職場技能工具。各位也可以關注我的Facebook,按讚我的臉書並私訊「10」,送你十週入門數據分析電子書唷!期待你與我互動起來~

文章推薦

餅圖變形記,肝了3000字,收藏就是學會!

MySQL必須掌握4種語言!

太實用了!4種方法教你輕鬆製作互動式儀表板!

跟資料打交道的人都得會的這8種資料模型,滿足工作中95%的需求

妙呀!一行Python程式碼

回顧十週入門數據分析系列文:

關注數據君的臉書:

我是「數據分析那些事」。常年分享數據分析乾貨,不定期分享好用的職場技能工具。按贊我的臉書,會有豐富資料包贈送唷!

--

--

數據分析那些事
數據分析那些事

Written by 數據分析那些事

這是一個專注於數據分析職場的內容部落格,聚焦一批數據分析愛好者,在這裡,我會分享數據分析相關知識點推送、(工具/書籍)等推薦、職場心得、熱點資訊剖析以及資源大盤點,希望同樣熱愛數據的我們一同進步! 臉書會有更多互動喔:https://www.facebook.com/shujvfenxi/

No responses yet