簡介
這是風靡網路的Facebook全球用戶熱度圖,該圖是先從Hive中抽取用戶的信息,再利用統計軟體R進行數據挖掘,然後根據定義的權重值畫線,最後用色盤來標識獲得。當然最為複雜的是這些連線處理,因為這些線條並非兩點間的直線,而是曲線。
數據可視化
數據可視化 Data Visualization 和信息可視化 Infographics 是兩個相近的專業領域名詞。
狹義上的數字可視化指的是將數據用統計圖表方式呈現,而信息圖形(信息可視化)則是將非數字的信息進行可視化。前者用於傳遞信息,後者用於表現抽象或複雜的概念、技術和信息。
廣義上數據可視化是信息可視化其中一類,因為信息是包含了:數字和非數字的。
從原詞的解釋來講:數據可視化重點突出的是”可視化”,而信息可視化則重點是”圖示化”。
整體而言:可視化就是數據、信息以及科學等等多個領域圖示化技術的統稱。
數據可視化起源於1960s計算機圖形學,人們使用計算機創建圖形圖表,可視化提取出來的數據,將數據的各種屬性和變數呈現出來。隨著計算機硬體的發展,人們創建更複雜規模更大的數字模型,發展了數據採集設備和數據保存設備。同理也需要更高級的計算機圖形學技術及方法來創建這些規模龐大的數據集。隨著數據可視化平台的拓展,套用領域的增加,表現形式的不斷變化,以及增加了諸如實時動態效果、用戶互動使用等,數據可視化像所有新興概念一樣邊界不斷擴大。
而我們熟悉的那些餅圖、直方圖、散點圖、柱狀圖等,是最原始的統計圖表,它們是數據可視化的最基礎和常見套用。作為一種統計學工具,用於創建一條快速認識數據集的捷徑,並成為一種令人信服的溝通手段。傳達存在於數據中的基本信息。所以我們可以在大量PPT、報表、方案以及新聞見到統計圖形。
但最原始統計圖表只能呈現基本的信息,發現數據之中的結構,可視化定量的數據結果。面對複雜或大規模異型數據集,比如商業分析、財務報表、人口狀況分布、媒體效果反饋、用戶行為數據等,數據可視化面臨處理的狀況會複雜得多。
一般包括數據的採集、分析、治理、管理、挖掘在內的一系列複雜數據處理,然後由設計師設計一種表現形式,是立體的、二維的、動態的、實時的還是允許互動的。然後由工程師創建對應的可視化算法及技術實現手段。包括建模方法、處理大規模數據的體系架構、互動技術、放大縮小方法等。動畫工程師考慮表面材質、動畫渲染方法等,互動設計師也會介入進行用戶互動行為模式的設計。
大型的數據可視化作品或項目的創建,需要多領域專業人士的協同工作才能取得成功,尤其是BI商業智慧型。人類能夠操縱和解釋如此來源多樣、錯綜複雜跨領域的信息,其本身就是一門藝術。
講透上述內容,讀者就明白為何是使用EXCEL來完成數據可視化的了 。
可視化套用
數據可視化的開發和大部分項目開發一樣,也是根據需求來根據數據維度或屬性進行篩選,根據目的和用戶群選用表現方式。同一份數據可以可視化成多種看起來截然不同的形式。
有的可視化目標是為了觀測、跟蹤數據,所以就要強調實時性、變化、運算能力,可能就會生成一份不停變化、可讀性強的圖表。
有的為了分析數據,所以要強調數據的呈現度、可能會生成一份可以檢索、互動式的圖表
有的為了發現數據之間的潛在關聯,可能會生成分散式的多維的圖表。
有的為了幫助普通用戶或商業用戶快速理解數據的含義或變化,會利用漂亮的顏色、動畫創建生動、明了,具有吸引力的圖表。
還有的被用於教育、宣傳或政治,被製作成海報、課件,出現在街頭、廣告手持、雜誌和集會上。這類可視化擁有強大的說服力,使用強烈的對比、置換等手段,可以創造出極具衝擊力自指人心的圖像。在國外許多媒體會根據新聞主題或數據,雇用設計師來創建可視化圖表對新聞主題進行輔助。
數據可視化的套用價值,其多樣性和表現力吸引了許多從業者,而其創作過程中的每一環節都有強大的專業背景支持。無論是動態還是靜態的可視化圖形,都為我們搭建了新的橋樑,讓我們能洞察世界的究竟、發現形形色色的關係,感受每時每刻圍繞在我們身邊的信息變化,還能讓我們理解其他形式下不易發掘的事物。