平行坐標是可視化高維幾何和分析多元數據的常用方法。
為了在n維空間中顯示一組點,繪製由n條平行線組成的背景,通常是垂直且等距的。所述的點N 維空間被表示為折線與頂點在平行的軸線; 第i 軸上頂點的位置對應於該點的第i個坐標。
此可視化與時間序列可視化密切相關,除了它套用於軸與時間點不對應的數據,因此沒有自然順序。因此,不同的軸布置可能是有意義的。
基本介紹
- 中文名:平行坐標
- 外文名:parallel coordinate
- 學科:數學術語
平行坐標詳解,歷史,更高的尺寸,統計考慮,
平行坐標詳解
為了表示在高維空間的一個點集, 在N條平行的線的背景下,(一般這N條線都豎直且等距),一個在高維空間的點被表示為一條拐點在N條平行坐標軸的折線,在第K個坐標軸上的位置就表示這個點在第K個維的值。
平行坐標是信息可視化的一種重要技術。為了克服傳統的笛卡爾直角坐標系容易耗盡空間、 難以表達三維以上數據的問題, 平行坐標將高維數據的各個變數用一系列相互平行的坐標軸表示, 變數值對應軸上位置。 為了反映變化趨勢和各個變數間相互關係,往往將描述不同變數的各點連線成折線。所以平行坐標圖的實質是將 維歐式空間的一個點Xi(xi1,xi2,...,xim) 映射到維平面上的一條曲線。
平行坐標圖可以表示超高維數據。 平行坐標的一個顯著優點是其具有良好的數學基礎, 其射影幾何解釋和對偶特性使它很適合用於可視化數據分析。
歷史
平行坐標通常被認為是由Philbert Maurice在1885年發明的但即使在書名中出現了“Coordonnéesparallèles”這個詞,但這項工作與相同的可視化技術無關名稱;這本書只描述了一種坐標變換的方法。但是即使在1885年之前,也使用了平行坐標,例如在亨利甘尼茨的“總摘要,顯示國家等級,按比率,1880年”,或之後在亨利甘尼茨“人口在每次人口普查中的排名,1790-1890“。他們在79年後再次被Alfred Inselberg推廣,在1959年,系統開發從1977年開始一些重要的套用是在一個坐標系防撞算法用於空中交通管制(1987-3美國專利),數據挖掘(美國專利),最佳化,過程控制,最近在入侵檢測和其他地方。
更高的尺寸
在具有xy笛卡爾坐標系的平面上,在平行坐標中添加更多尺寸涉及添加更多的坐標軸。平行坐標的值是高維中的某些幾何特性轉化為容易看到的2D圖案。例如,在一列的一組點的Ñ-space轉變為一組的多段線在平行坐標在所有交叉n- 1分。對於n= 2,這產生了一個點線二元性,指出為什麼平行坐標的數學基礎是在投影而不是歐氏理論中發展起來的空間。一對線相交於具有兩個坐標的唯一點,因此可以對應於也由兩個參數(或兩個點)指定的唯一線。相比之下,指定曲線需要兩個以上的點,並且一對曲線可能沒有唯一的交點。因此,通過使用平行坐標而不是線的曲線,點線對偶性與投影幾何的所有其他性質一起丟失,並且已知的與(超)平面,曲線,幾個平滑(超)表面對應的更好的高維圖案,近似度,凸度和最近的不可定向性。目標是將n維關係映射為2D模式。因此,平行坐標不是點對點映射,而是nD子集到2D子集映射,信息不會丟失。注意:即使是nD中的一個點也不會映射到2D中的一個點上,而是映射到一個折線2D的一個子集。
統計考慮
當用於統計數據可視化時,有三個重要的考慮因素:軸的順序,旋轉和縮放。
軸的順序對於查找特徵至關重要,並且在典型的數據分析中,需要嘗試許多重新排序。一些作者提出了訂購啟發式方法,這可能會產生照明順序。
軸的旋轉是平行坐標中的平移,並且如果線在平行軸之外相交,則它們可以通過旋轉在它們之間平移。最簡單的例子就是將軸旋轉180度。
縮放是必要的,因為該圖基於連續變數對的插值(線性組合)。因此,變數必須具有共同的規模,並且有許多縮放方法可以作為數據準備過程的一部分來考慮,這可以揭示更多信息量的視圖。
樣條曲線可以實現平滑的平行坐標圖。在平滑圖中,每個觀測值都被映射到參數線(或曲線),該參數線在光軸上是平滑的,連續的並且與每個平行軸正交。這種設計強調每個數據屬性的量化級別。如果使用度數的傅立葉插值等於數據維數,則可以得到安德魯斯曲線。