大數據叢書:數據可視化

大數據叢書:數據可視化

《大數據叢書:數據可視化》是2013年電子工業出版社出版的圖書,作者是陳為、沈則潛。

基本介紹

  • 書名:大數據叢書:數據可視化
  • 類型:計算機與網際網路
  • 出版日期:2013年12月1日
  • 語種:簡體中文
  • ISBN:7121211548
  • 作者:陳為 沈則潛
  • 出版社:電子工業出版社
  • 頁數:647頁
  • 開本:16
  • 品牌:電子工業出版社
基本介紹,內容簡介,作者簡介,圖書目錄,序言,

基本介紹

內容簡介

全書共有16 章,分為4 篇。基礎篇,闡述數據可視化的基礎理論和概念,從人的感知和認知出發,介紹數據模型和可視化基礎;時空數據篇,介紹帶有空間坐標或時間信息的數據的可視化方法,此類數據通過設備在真實物理空間中採集得到或由科學計算模擬產生;非時空數據篇,描述非結構化和非幾何的抽象數據的可視化,這些數據既存在於真實物理空間,又是社會空間和網路信息空間的基本表達形式;用戶篇,介紹面向各類數據的可視化在實際套用中共同需要的方法、技術和工具,例如互動和可視化評測方法,以及在具體領域的可視化和套用系統。
面對龐雜的大數據,可視化提供了良好的解讀角度與方法,是大數據分析與套用的利器。
本書首次全面、細緻地梳理了可視化的歷史,理論,工具與套用案例,旁徵博引,圖文並茂,內容翔實豐富,專業嚴謹,是了解可視化知識的不二之選,也特別值得相關從業人員作為案頭參考書備存。
本書入選十二五國家重點圖書出版規劃項目“大數據叢書”,並獲得該領域著名學術帶頭人之一馬匡六教授,石教英教授的專序推薦。
本書同時配備了線上資料提供與更新服務,讀者可以隨時與作者互動,深入探討。

作者簡介

陳為,浙江大學CAD&CG國家重點實驗室教授,博士生導師。已主持國家973項目子課題、863高科技項目、國家自然科學基金重點項目、面上項目、青年基金項目等10餘項。2012年獲浙江省科學技術獎二等獎。2004年起與耿衛東教授開設“計算機遊戲程式設計”課程,編著的課程教材被國內外10餘所高校採用,並在大中華地區出版繁體字版本。2010年課程被評為國家精品課程,2012年教材入選十二五國家教材規劃。2011年起,開設本科生課程“數據可視化”。研究興趣包括可視化和可視分析。在國際一流學術期刊發表論文30餘篇。擔任期刊《計算機輔助設計與圖形學學報》編委,多次擔任國際著名學術會議程式委員會委員(IEEE Visualization,EuroVis, EuroGraphics,Pacific Graphics,CGI,Pacific Vis等),擔任IEEE Pacific Visualization 2011和2012分論壇主席、VINCI國際會議大會主席(2010,2012)IEEE Pacific Visualization 2013大會論文主席。
沈則潛,博士,美國eBay研究院資深科學家。1997年至2001年本科就讀於浙江大學計算機科學與工程學系。2002年至2004年在美國田納西大學諾克斯維爾分校電子與計算機工程學系學習並獲得碩士學位。2004年至2009年就讀於美國加州大學戴維斯分校,師從IEEE Fellow馬匡六教授,獲信息可視化方向博士學位。2008年7月進入eBay研究院工作,從事海量數據分析和可視化的研發工作。研究興趣包括信息可視化和可視分析,特別是大數據可視化、用戶行為分析和社交網路的可視分析。在國際一流學術期刊和會議發表論文多篇,包括IEEE TVCG,IEEE VisWeek,EuroVis等。多次受邀參加國際頂尖學術期刊和會議的評審工作。
陶煜波,博士,浙江大學CAD&CG國家重點實驗室講師。於2003年、2009年分別獲得浙江大學學士、博士學位。之後在浙江大學進行博士後研究,2010年至2012年在英國貝德福德大學作為博士後從事生物醫學可視化研究,2012年9月進入浙江大學CAD&CG國家重點實驗室工作,已主持國家自然科學基金青年基金項目1項。研究興趣包括電磁計算、科學計算可視化和可視分析。在國際一流學術期刊和會議發表論文多篇,包括IEEE TVCG,IEEE TIM,IEEE TAP等。多次受邀參加國際學術期刊和會議的評審工作。

圖書目錄

基礎篇
第1章數據可視化簡介
1.1可視化釋義
1.2可視化簡史
1.3數據可視化詳解
1.3.1數據科學的發展
1.3.2數據可視化的意義
1.3.3數據可視化分類
1.3.4數據可視化與其他學科領域的關係
1.4數據可視化研究挑戰
參考文獻
第2章視覺感知與認知
2.1視覺感知和認知
2.1.1視覺感知和認知的定義
2.1.2視覺感知處理過程
2.1.3格式塔理論
2.2顏色
2.2.1顏色刺激理論
2.2.2色彩空間
2.3視覺編碼原則
2.3.1相對性和絕對性
2.3.2標記和視覺通道
2.3.3視覺通道的概念
2.3.4視覺通道的特性
參考文獻
第3章數據
3.1數據釋義
3.1.1數據基礎
3.1.2數據科學及過程
3.2數據獲取和預處理
3.2.1數據獲取
3.2.2數據預處理
3.3數據組織與管理
3.3.1數據清洗與精簡
3.3.2數據整合與集成
3.3.3資料庫
3.3.4數據倉庫
3.4數據分析與挖掘
3.4.1探索式數據分析
3.4.2在線上分析處理
3.4.3數據挖掘
3.5數據工作流
3.6數據科學的挑戰
參考文獻
第4章數據可視化基礎
4.1數據可視化基本框架
4.1.1數據可視化流程
4.1.2數據可視化設計
4.2可視化中的數據
4.2.1數據認知
4.2.2數據類型
4.3可視化的基本圖表
4.3.1原始數據繪圖
4.3.2簡單統計值標繪
4.3.3多視圖協調關聯
4.4可視化設計原則
4.4.1數據到可視化的直觀映射
4.4.2視圖選擇與互動設計
4.4.3信息密度——數據的篩選
4.4.4美學因素
4.4.5動畫與過渡
4.4.6可視化隱喻
4.4.7顏色與透明度
4.5可視化理論發展
4.5.1圖形符號學
4.5.2關係數據的圖形表示
4.5.3圖形語法
4.5.4基於數據類型的研究
4.5.5基於數據狀態模型的研究
4.5.6多維關係資料庫可視化分析系統
參考文獻
時空數據篇
第5章空間標量場可視化
5.1一維標量場可視化
5.2二維標量場可視化
5.2.1顏色映射
5.2.2等值線提取
5.2.3高度圖
5.3三維標量場數據可視化
5.3.1空間數據表達
5.3.2空間數據特徵計算
5.3.3間接體繪製
5.3.4規則三維標量場的直接體可視化
5.3.5不規則體數據的體可視化
參考文獻
第6章地理信息可視化
6.1地圖投影
6.1.1墨卡托投影
6.1.2亞爾勃斯投影
6.1.3方位角投影
6.2點數據的可視化
6.3線數據的可視化
6.4區域數據的可視化
6.4.1Choropleth地圖
6.4.2Cartogram
6.4.3規則形狀地圖
6.4.4多元關係地圖
6.5地理信息可視化的套用
6.5.1地球與生存環境
6.5.2城市與日常生活
6.5.3地理時空數據
6.5.4複雜地理數據的可視分析
6.6地理信息可視化的其他挑戰
6.6.1地圖示注
6.6.2地圖綜合
6.6.3線上地圖
參考文獻
第7章大規模多變數空間數據場可視化
7.1大規模空間標量場數據的實時體可視化
7.1.1大規模空間標量場數據的單機繪製
7.1.2大規模空間標量場數據的並行繪製
7.1.3時變空間標量場數據加速繪製方法
7.2時變異構空間數據場的特徵追蹤與可視化
7.2.1時變空間標量場數據的特徵提取
7.2.2異構數據的特徵融合
7.2.3時變空間標量場數據的特徵追蹤
7.3空間向量場數據可視化
7.3.1圖示法
7.3.2幾何法
7.3.3紋理法
7.3.4拓撲法
7.4空間張量場數據可視化
7.4.1張量場的數學描述
7.4.2基於幾何的方法
7.4.3基於紋理的方法
7.4.4基於拓撲的方法
7.4.5高階張量場可視化
7.5多變數空間數據場可視化
7.5.1多變數空間數據場的數據分析與表達
7.5.2多變數空間數據場的可視化與互動
參考文獻
第8章時變數據可視化
8.1時間屬性的可視化
8.1.1線性和周期時間可視化
8.1.2日曆時間可視化
8.1.3分支和多角度時間可視化
8.1.4時間屬性的動態可視化
8.2多變數時變型數據可視化
8.2.1基於線表示的可視化
8.2.2基於圖結構的可視化
8.2.3時間序列數據的可視化互動
8.3流數據可視化
8.3.1流數據可視化模型
8.3.2流數據處理技術
8.3.3流數據可視化案例
8.3.4並行流計算框架
參考文獻
……
非時空數據篇
用戶篇

序言

Visualization, as a discipline in computer science, is a rather young field of study. The field has made many advances over the past 25 years through tremendous basic and application-driven research efforts, and also successfully transferred some of these advances into products and services for data-intensive applications. Visualization as a problem-solving and knowledge discovery tool has become even more important as we enter the Big Data era. Its applications grow from scientific computing, engineering design, biomedicine, cyber security, and intelligence, to social science, transportation studies, and commerce. Visualization will be considered a basic skill, and will likely become part of the standard curriculum in science and engineering.
There is clearly a fast-growing interest in visualization as a discipline, a technology, or a practice. Over the years, I have been asked by many to suggest readings in visualization.So far, no book has ever managed to provide a comprehensive overview of the field,since even the good ones focus on a subarea of visualization, typically reflecting the author’s research endeavors. A visualization textbook is definitely needed. I know a few other book projects are underway, but this book is by far the most comprehensive one I have seen. It provides a fairly complete introduction to essential topics in visualization,as well as information on where the field is today, effectively serving the needs of both practitioners and future researchers in the field. As the field evolves rapidly to cope with demands from new applications and exploiting Big Data, I believe the authors will update the content regularly to reflect the latest and greatest developments in the field,which will make this book a lasting, valuable resource.
While visualization has become an active area of study and practice in the United States and Europe, visualization research and education in Asia would benefit from increased promotion and development. Thus, the publication of this textbook is timely. I praise the dedicated effort of Professor Wei Chen and his co-authors in creating this book, which will help accelerate visualization education, research, and practice in China and other Chinese-speaking countries. I hope to see this book translated into other languages. It will then become an important reference in the field of visualization. I found the book very informative and easy to read. I believe you will enjoy reading it.
Kwan-Liu Ma
Davis, CA
September 20, 2013

浙江大學計算機輔助設計與圖形學(CAD&CG)國家重點實驗室陳為教授來電話,請我為他的新作《數據可視化》作序。陳為教授是我的老同事,也是我們實驗室可視化方向的帶頭人。現在他有新作出版,請我作序是對我的尊重,我哪有不懂之理。然而我猶豫了。我坦率地告訴他,我怕完不成任務,因為我已退休多年,不再跟蹤學科前沿多年。陳為說,他把書稿連結發給我,請我瀏覽以後再作定奪。我在瀏覽了《數據可視化》的內容簡介、前言、目錄和第1 章後,深感全書內容十分豐富,架構嚴謹,是我國學界和業界急需的一本好書。陳教授在信里還寫道:“可否請您從可視化在中國的發展歷史、現狀、未來為這本書寫一個序言,作為對我們的鼓勵。”讀信後,我感到我寫不出現狀和未來,寫點我經歷過的事情,以及談點作為過來人的體會和建議還是可以的,同時我感到作為可視化領域的一名老兵面對《數據可視化》這樣一本可視化新作、好書,又有愛不釋手和責無旁貸之感,當即決定試試。
“可視化”或它的全稱“科學計算可視化”(Visualization in Scientific Computing,縮寫為ViSC)一詞是在1987 年根據美國國家科學基金會召開的“科學計算可視化研討會”內容撰寫的一份報告中正式提出的。在短短20 餘年歷史中,科學計算可視化發展成為一個十分活躍的研究領域,新的研究分支不斷湧現,如出現了用以表示海量數據不同類型及其邏輯關係的信息可視化技術,以及將可視化與分析相結合的可視分析學研究方向。現在又有了把“科學計算可視化”、“信息可視化”和“可視分析學”這三個分支整合在一起的新學科“數據可視化”。這是可視化研究領域的新起點,必將進一步促進學科交叉與融合,進一步擴大套用領域的發展,進一步提高套用水平。可以預期,這波數據可視化研究新浪潮必將推動可視化學科研究和套用向更寬、更深、更高的方向發展。事實上,這既是學界和業界的責任,也是廣大用戶的期待,因為現有的可視化技術還遠遠滿足不了用戶的期望。我舉一個親身體驗來說明我的這個論斷。去年8 月我的小孫女出生,面對可愛的小臉,腦海里不由得回憶起3 個月前看到兒子發來的那張胎兒超音波三維影像時留下的印象:緊閉的雙目,高額頭和大鼻子。今天小天使雖然依然雙目緊閉,依然是高額頭,但鼻子一點也不大,反而顯得小巧、可愛,加上時張時合的小嘴,這張真實的小臉與那張高科技三維圖像相比不知要漂亮多少倍。這個事實說明,今天的超音波三維成像技術離用戶期望水平還相去甚遠。我們全家在感謝今天科技進步讓我們提前3 個月看到了小孫女的真容的同時,也期望科學家們早日提供逼真的胎兒三維影像。
應該說,我們國家可視化方向的研究工作起步還是比較早的。國家自然科學基金委將科學計算可視化列為“八五”重點資助項目,國家科委也將其列為基礎研究專門項目給予資助。國內一批圖形學研究中心,如浙江大學計算機輔助設計與圖形學國家重點實驗室、清華大學計算機系、中科院CAD 開放實驗室和中科院軟體所等單位在20 世紀90年代初相繼開展了可視化方向的基礎研究和套用研究。我們這一代人遇到的最大困難是信息閉塞,很多信息都是從國際學術交流中取得的。例如,我是在1991 年3 月至7 月在德國Encarnacao 教授領導的弗朗霍夫圖形學研究所(FhG-IGD)作訪問研究,在MartinGoebel 博士領導的可視化研究室工作時接觸科學計算可視化研究方向的。我有幸與研究室內一批年輕博士一起工作4 個月為我奠定了從事可視化學科的基礎。回國後我在浙江大學CAD&CG 國家重點實驗室大力倡導,並組織年輕教師和博士生開展可視化方向的研究工作,很快出現了一批較高水平的研究成果,影響並推動了可視化研究方向在國內普及。基於可視化方向的廣泛套用背景,我們從1993 年9 月起在浙江大學為全校理工科碩士和博士研究生開設“科學計算可視化”全校性選修課。1995 年4 月23 日至27 日由我們實驗室牽頭舉辦了虛擬現實與科學計算可視化國際研討會(International Workshop on VR-ViSC)。同時為國內青年學者和學生舉辦同名高級研討班,請出席國際研討會的一批國內外著名學者為國內高級研討班學員作報告,取得了很好的效果。這應是我國第一次舉辦VR-ViSC 專題國際研討會和同名國內高級研討班,讓國外學者有機會了解我國學者在這個領域的研究成果,也讓國內學者和學生有機會接觸世界一流學者。我想藉此機會向Encarnacao 教授表示我們最誠摯的謝意,是他幫助我們解決了國外學者來華的費用。歐洲學者費用是他出面向歐盟申請的,北美加拿大和美國學者來華費用也是Encarnacao 教授出面通過他的老朋友Larry L. Rosenblum 教授向美國國家科學基金會申請的。Larry 是美國海軍研究生院教授,曾任美國國家科學基金會計算機學部主任。直到2006 年4 月16 日我的一批國外老朋友應邀參加我的70 歲生日慶祝大會,幾位老朋友到我的新居做客,其中就有Larry,這是他第一次訪問中國。我如此冗長地介紹1995 年研討會和一批國外老朋友無非是想強調國際學術交流的重要,以及強調國外一流學者的敬業精神值得我們永遠學習。1996 年9 月由石教英、蔡文立等編著的《科學計算可視化算法與系統》一書由科學出版社出版。這應是我國學者編著的第一本可視化教材,曾在國內高校套用多年,遺憾的是至今沒有更新再版。計算機類教科書哪有十幾年不更新的,早該淘汰了。
我除了欣賞《數據可視化》一書內容翔實、架構嚴謹、圖表精美外,我更欣賞和看重的是本書前言裡列出的執筆者,也就是作者名單。這張名單清晰地表明各個章節的作者姓名。我欣賞的就是這種既強調智慧財產權保護,又明確文責自負的做法。我一直認為我國智慧財產權保護不力是制約我國科技創新的罪魁禍首!我欣賞陳為教授嚴謹的智慧財產權保護意識和實踐。保護智慧財產權從我們每個科技工作者做起當然是應該的,但我更希望我國各級科技主管重視智慧財產權保護對我國科技創新的影響問題,也希望各級行政執法主管嚴格執法,嚴格保護智慧財產權。更希望中央媒體能像報導全國道德模範一樣報導一批因智慧財產權而致富的知識分子實例。我想一旦智慧財產權可以致富意識深入人心,榜樣的力量就將是無窮的。
最後請容許我再向青年學者說幾句心裡話。你們從事的可視化研究領域屬套用基礎研究範疇,具有很強的套用性,因此希望你們重視套用研究,做有用的研究,多與產業界聯繫;不要隨波逐流跟著考核指揮棒走,一味追逐論文數、獎項數和科研經費數;學術評價標準是影響力,而不是這個數那個數,分學術影響力和產業影響力兩類:學術影響力看的是發表的學術論文級別,真正有影響力的論文只有頂級論文,能產出頂級論文的只有少數人,且只能在其創造力旺盛的有限歲月才有可能發表頂級學術論文;產業影響力是看你的成果在產業界的套用效果,所有有真才實學的人都能有所貢獻,且可能是終生都會有所貢獻。你可能會說沒有論文,拿不到博士學位,升不了職稱,沒有科研經費無法帶研究生,等等。是的,這裡就有個度以及你的看法問題,這就是先賢王陽明先生說的“良知”(我們對事物的最初反應,也是我們本性的表現);王陽明還提出“致良知”說,就是指我們應該遵從自己的良知而行,即將良知付諸實踐。因此,這是一個複雜而又現實的問題,我前面說了“不要隨波逐流”,現在又說要“致良知”,即要按自己想清楚的去做,一句話就是:要獨立思考,不要隨大流。
東拉西扯地寫了一大堆,請陳教授諒解,也請諸位讀者諒解。
石教英
浙江大學計算機輔助設計與圖形學國家重點實驗室
2013 年9 月11 日

數據的採集、提取和理解是人類感知和認識世界的基本途徑之一,數據可視化為人類洞察數據的內涵、理解數據蘊藏的規律提供了重要的手段。
隨著數據時代的來臨,大數據的分析、挖掘與可視化已經成為信息技術發展的迫切需求。面對當前科學可視化、信息可視化、可視分析研究和套用的新形勢,需要發展新的複雜數據的處理、分析與可視化方法,並圍繞實際科學和社會問題的求解設計高效的人機互動界面。目前,國內急需面向資訊時代中各類數據特性和套用領域介紹數據可視化基本理論與方法的工具書。
本書從研究者的視角,介紹了數據可視化的定義、方法、功效和實用軟體,可作為初學者入門的嚮導,是有關科研和教育人員從事可視化研究和開發的一本實用的參考書。全書共有16 章,分為4 篇:基礎篇、時空數據篇、非時空數據篇和用戶篇。
基礎篇(第1~4 章)闡述數據可視化的基礎理論和概念,從人的感知和認知出發,介紹數據模型和可視化基礎。第1 章闡述可視化的定義、作用和發展歷史,給出數據可視化的現代意義和分類。第2 章詳細介紹視覺感知和認知的基本原理、顏色模型和可視化編碼原則。第3 章介紹數據模型、數據定義、數據組織與管理、數據分析與挖掘等基本概念。第4 章闡述數據可視化基礎,包括可視化流程、圖形符號、視覺變數和評估方法等內容。根據數據的時空特性,數據可分為時空數據和非時空數據。
時空數據篇(第5~8 章)介紹含有空間坐標或時間信息的數據的可視化方法,此類數據通過測量儀器在真實物理空間中採集或由科學計算模擬生成。空間數據可分為標量、向量和張量三大類。第5 章介紹空間標量場數據可視化,主要涵蓋一維、二維和三維空間的標量場數據。第6 章介紹含有地理信息的空間數據的可視化技術。第7 章介紹大尺度或隨時間變化的空間標量場數據的可視化解決方案和挑戰,空間向量場和張量場數據的可視化方法,多變數空間數據場的可視化。第8 章關注帶有時間信息的數據可視化,包括時間屬性可視化、多變數時變型數據可視化和流數據可視化。
非時空數據篇(第9~12 章)描述非結構和非幾何的抽象數據的可視化,這類數據既存在於真實物理空間,也存在於社會空間和網路信息空間。第9 ~ 12 章分別介紹層次結構數據可視化、文本數據可視化、跨媒體數據可視化和複雜高維多元數據可視化。特別地,非時空數據具有高維、大尺度、異構、複雜等特點。第12 章介紹最新的有關複雜高維多元數據可視化的方法,處理對象包括多變數非結構化數據、大規模數據、異構數據和不確定性數據等。
用戶篇(第13~16 章)介紹實際套用中各類數據可視化需採用的共性、技術和工具以及具體的套用系統。第13 章介紹可視化中的互動方法,包括互動準則、互動分類和相關技術。第14 章介紹可視化評測,闡述可視化評測的因素、方法、流程和具體實例。第15章介紹面向科學計算、生命醫學、網路安全、商業智慧型和金融等領域的可視化技術。第16 章介紹可視化系統,包括套用系統、數據資源、開發工具和全球重要的可視化研究小組等信息。
本書作者
於2013 年6 月

相關詞條

熱門詞條

聯絡我們