視覺化發展史與測量、繪畫、人類現代文明的啟蒙和科技的發展一脈相承。在地圖、科學與工程製圖、統計圖表中,視覺化理念與技術已經應用和發展了數百年。
17世紀之前:圖表萌芽
16世紀時,人類已經掌握了精確的觀測技術和裝置,也採用手工方式製作視覺化作品。視覺化的萌芽出自幾何圖表和地圖生成,其目的是展示一些重要的資訊,見圖1和圖2。
1600–1699年:物理測量
17世紀最重要的科學進展是對物理基本量(時間、距離和空間)的測量裝置與理論的完善,它們被廣泛用於航空、測繪、製圖、瀏覽和國土勘探等。同時,製圖學理論與實踐也隨著分析幾何、測量誤差、機率論、人口統計和政治版圖的發展而迅速成長。17世紀末,甚至產生了基於真實測量資料的視覺化方法(見圖3和4)。從這時起,人類開始了視覺化思考的新模式。
1700–1799年:圖形符號
進入18世紀,繪圖師不再滿足於在地圖上展現幾何資訊,發明了新的圖形化形式(等值線、輪廓線)和其他物理資訊的概念圖(地理、經濟、醫學),見圖5和圖6。隨著統計理論、實驗數據分析的發展,抽象圖和函式圖被廣泛發明。
18世紀是統計圖形學的繁榮時期,其奠基人William Playfair發明了折線圖、柱狀圖、顯示區域性與整體關係的餅狀圖和圓圖等今天最常用的統計圖表(見圖7和圖8)。
1800–1900年:資料圖形
隨著工藝設計的完善,19世紀上半葉,統計圖形、概念圖等迅猛爆發,此時人們已經掌握了整套統計資料視覺化工具,包括柱狀圖、餅圖、直方圖、折線圖、時間線、輪廓線等。關於社會、地理、醫學和經濟的統計資料越來越多,將國家的統計資料和其可視表達放在地圖上,產生了概念製圖的新思維,其作用開始體現在政府規劃和營運中。採用統計圖表來輔助思考的誕生同時衍生了視覺化思考的新方式:圖表用於表達數學證明和函式;列線圖用於輔助計算;各類視覺化顯示用於表達資料的趨勢和分佈,便於交流、獲取和視覺化觀察。圖9至圖14展示了部分例項。
19世紀下半葉,系統地構建視覺化方法的條件日漸成熟,進入了統計圖形學的黃金時期。值得一提的是法國人Charles Joseph Minard,他是將視覺化應用於工程和統計的先驅者。其最著名的工作是1869年釋出的描繪1812–1813年拿破崙進軍莫斯科大敗而歸的歷史事件的流圖,這幅圖如實地呈現了軍隊的位置和行軍方向、軍隊匯聚、分散和重聚的地點與時間、軍隊減員的過程、撤退時低溫造成的減員等資訊,見圖10。
1900–1949年:現代啟蒙
20世紀上半葉對於視覺化而言是一個缺乏創新的時期,但是視覺化隨著統計圖形的主流化開始面向政府、商業和科學走向應用普及(見圖15和16),人們第一次意識到圖形顯示的方式能為航空、物理、天文和生物等科學與工程領域提供新的洞察和發現機會。多維資料視覺化和心理學的介入成為這個時期的重要特點。
1950–1974年:多維資訊的可視編碼
1967年,法國人Jacques Bertin出版了Semiology of Graphics(《圖形符號學》)一書[Bertin1983],確定了構成圖形的基本要素,並且描述了一種關於圖形設計的框架。這套理論奠定了資訊視覺化的理論基石。隨著個人計算機的普及,人們逐漸開始採用計算機程式設計生成視覺化。圖17至圖19展示了這個時期的一些代表性工作。
1975–1987年:多維統計圖形
20世紀70年代以後,桌面作業系統、計算機圖形學、圖形顯示裝置、人機互動等技術的發展激發了人們程式設計實現互動式視覺化的熱情。處理範圍從簡單的統計資料擴充套件為更復雜的網路、層次、資料庫、文字等非結構化與高維資料。與此同時,高效能計算、平行計算的理論與產品正處於研製階段,催生了面向科學與工程的大規模計算方法。資料密集型計算開始走上歷史舞臺,也造就了對於數據分析和呈現的更高需求。
1977年,美國著名統計學家John Tukey發表了“探索式數據分析”的基本框架,它的重點並不是視覺化的效果,而是將視覺化引入統計分析,促進對資料的深入理解。1982年,Edward Tufte出版了The Visual Display of Quantitative Information一書 [Tufte1992],構建了關於資訊的二維圖形顯示的理論,強調有用資訊密度的最大化問題。這些理論會同Jacques Bertin的圖形符號學,逐漸推動資訊視覺化發展成一門學科 [Cleveland1993][Cleveland1994]。圖20至圖24展現了部分具有里程碑意義的資訊視覺化方法。
1987–2004年:互動視覺化
1986年10月,美國國家科學基金會主辦了一次名為“圖形學、影象處理及工作站專題討論”的研討會,旨在為從事科學計算工作的研究機構提出方向性建議。會議將計算機圖形學和影象方法應用於計算科學的學科稱為“科學計算之中的視覺化”(Visualization in Scientific Computing,簡稱ViSC)。1987年2月,美國國家科學基金會召開了首次有關科學視覺化的會議,召集了眾多來自學術界、工業界以及政府部門的研究人員,會議報告正式命名並定義了科學視覺化(Scientific Visualization),認為視覺化有助於統一計算機圖形學、影象處理、計算機視覺、計算機輔助設計、訊號處理和人機介面中的相關問題,具有培育和促進科學突破和工程實踐的潛力。同年,在圖形學頂級會議ACM SIGGRAPH上,來自美國GE公司的William Lorensen和Harvey Cline發表了“行動立方體法”(Marching Cubes)一文,開創了科學視覺化的熱潮。這篇論文是有史以來ACM SIGGRAPH會議被引用最高的論文。1989年,國際期刊Computer發表了一期關於科學計算中的視覺化研究的專刊[Nielson1989]。
20世紀70年代以後,放射影像從X-射線發展到計算機斷層掃描(CT)和核磁共振影象(MRI)技術。1989年,美國國家醫學圖書館(NLM)實施視覺化人體計劃。科羅拉多大學醫學院將一具男性和一具女性屍體從頭到腳做 CT掃描和核磁共振掃描,男的間距1毫米,共1878 個斷面;女的間距0.33毫米,共5189個斷面,然後將屍體填充藍色乳膠並裹以明膠後冰凍至零下80攝氏度,再以同樣的間距對屍體作組織切片的數碼相機攝影,如圖25左圖所示,解析度為2048×1216,所得資料共56GB。這兩套資料集極大地促進了三維醫學視覺化的發展,成為視覺化標杆式的應用範例。
1990年,IEEE舉辦了首屆IEEE Visualization Conference,彙集了一個由物理、化學、計算、生物醫學、圖形學、影象處理等交叉學科領域研究人員組成的學術群體。2012年,為突出科學視覺化的內涵,會議更名為IEEE Conference on Scientific Visualization。自18世紀後期統計圖形學誕生後,針對抽象資訊的視覺表達手段仍然在不斷髮展,被用於揭示資料及其他隱匿模式的奧秘。與此同時,數位化的非幾何的抽象資料如金融交易、社交網路、文字資料等大量湧現,促生了多維、時變、非結構化資訊的視覺化需求。圖26顯示了面向層次結構資料的樹圖視覺化結果;圖27展示了美國施樂公司發明的表格透鏡技術,它允許人們以凸透鏡的方式來獲得對大尺度表格焦點+上下文的體驗。
20世紀80年代末,視窗系統的問世使得人們能夠直接與資訊進行互動。1988年,著名的統計圖形學學者William Cleverland在其著作Dynamic Graphics for Statistics中詳細總結了面向多變數統計資料的動態視覺化手段。1989年,Card、Mackinlay和Robertson等人採用“Information Visualization”(資訊視覺化)命名這個學科,其研究思想和範疇是對統計圖形學的昇華。從1995年開始,出現了單獨面向資訊視覺化的會議 — — IEEE Information Visualization會議,它以研討會(Symposium)的形式附屬於IEEE Visualization會議。2007年,研討會改名為IEEE Conference on Information Visualization。
2004年至今:可視分析學
進入21世紀,現有的視覺化技術已難以應對海量、高維、多源和動態資料的分析挑戰,需要綜合視覺化、圖形學、資料探勘理論與方法,研究新的理論模型、新的視覺化方法和新的使用者互動手段,輔助使用者從大尺度、複雜、矛盾甚至不完整的資料中快速挖掘有用的資訊,以便做出有效決策。這門新興的學科稱為可視分析學。可視分析學是一門新興的學科,其核心理論基礎和研究方法尚處於探索階段。從2004年起,研究界和工業界都沿著面向實際資料庫、基於視覺化的分析推理與決策、解決實際問題等方向發展。
例如:
圖29展示了視覺化分析軟體Palantir(http://www.palantir.com),它允許使用者連線多個網路資料庫,互動地分析資料,建立人、事件、地點之間的關聯,解決複雜的問題,發現隱藏的規律。
2005年,美國國家科學基金會聯合美國國家衛生研究所召集了一個新的專題小組,討論視覺化研究的現狀和麵臨的挑戰,並於2006年釋出了一個專題報告來描述大規模資料視覺化所面臨的挑戰。與此同時,2004年美國國土安全部為了應對恐怖襲擊,成立了國家可視分析中心,2005年釋出的“可視分析的研究和發展規劃”報告全面闡述了可視分析的挑戰。2006年,IEEE開設了國際會議(IEEE Symposium on Visual Analytics Science and Technology)。2012年更名為IEEE Conference on Visual Analytics Science and Technology。同時,歐盟歐洲視覺化年會EuroVis從2010年起,專門舉辦可視分析研討會EuroVAST。
文章來源:可以叫我才哥
原文連結:https://mp.weixin.qq.com/s/39JCRsoGsjY1-dwpGB8Anw
※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※
我是「數據分析那些事」。常年分享數據分析乾貨,不定期分享好用的職場技能工具。各位也可以關注我的Facebook,按讚我的臉書並私訊「10」,送你十週入門數據分析電子書唷!期待你與我互動起來~
文章推薦
◆跟資料打交道的人都得會的這8種資料模型,滿足工作中95%的需求
回顧十週入門數據分析系列文:
關注數據君的臉書:
我是「數據分析那些事」。常年分享數據分析乾貨,不定期分享好用的職場技能工具。按贊我的臉書,會有豐富資料包贈送唷!