多變數圖表示法

多變數圖表示法

多變數的圖表示法是將多變數用平面上的直觀圖形進行表示,以幫助人們去思維和判斷。常用的圖表示法有:雷達圖、塑膠圖、輪廊圖、星座圖、臉譜圖等等。

基本介紹

  • 中文名:多變數圖表示法
  • 所屬學科:數學(統計學)
  • 簡介:多變數用平面上的直觀圖形進行
  • 舉例雷達圖、塑膠圖、輪廊圖等
基本介紹,常見的多變數圖表示法,散點圖矩陣,臉譜圖,雷達圖和星圖,星座圖,

基本介紹

圖形是對數據資料進行探索性研究的重要工具,當人們在運用其他統計方法對所得數據資料進行分析之前,往往習慣於把各數據在一張圖上畫出來,以直觀地反映資料的分布情況及各變數之間的相關關係。當變數較少時,可以採用直方圖條形圖餅圖散點圖或是經驗分布的密度圖等方法,對於變數個數少於3的情況,這樣做是簡單而有效的。而當變數個數為3時,雖然仍可以做三維的散點圖,但這樣做已經不是很方便,當變數個數大於3時,就不能用通常的方法作圖了。自20世紀70年代以來,統計學家研究發明了很多多維變數的圖表示方法,以藉助圖形來描述多元數據資料的統計特性,使圖形直觀、簡潔的優點延伸到多變數的研究中去,例如有散點圖矩陣、臉譜圖、塑像圖、輪廓圖、雷達圖等多變數的圖表示法的基本思想及作圖方法。
因為對數據資料的圖表示法只是以一種直觀的方式再現資料,不同的研究者習慣的資料顯示方式可能會有很大不同,因此,不同於其他統計方法,大部分圖表示法都沒有非常嚴格的畫圖方法,研究者可以根據自己的習慣設定某些規則以更方便地揭示數據之問的聯繫。故此,本章對各種圖表示方法原則上只給出作圖的思想及思路,而不對嚴格的數學公式作過多說明。

常見的多變數圖表示法

散點圖矩陣

散點圖矩陣是藉助兩變數散點圖的作圖方法,它可以看作是一個大的圖形方陣,其每一個非主對角元素的位置上是對應行的變數與對應列的變數的散點圖。而主對角元素位置上是各變數名,這樣,藉助散點圖矩陣可以清晰地看到所研究多個變數兩兩之間的相關關係。由此也可以看出,散點圖矩陣方法還不是真正意義上的多變數作圖方法,它反映的仍是兩兩變數之間的相關關係,而不能直接反映多個變數之間的關係,藉助它來對資料分類也是比較困難的;然而,因其直觀,簡單,容易理解,散點圖矩陣還是受到了廣大實際工作者的喜愛,很多統計軟體也加入了作散點圖矩陣的功能。
圖1  散點圖矩陣圖1 散點圖矩陣

臉譜圖

臉譜圖是用臉譜來表達多變數的樣品,由美國統計學家H.Chernoff於1970年首先提出,該方法是將觀測的p個變數(指針)分別用臉的某一部位的形狀或大小來表示,一個樣品(觀測)可以畫成一張臉譜。他首先將該方法用於聚類分析,引起了各國統計學家的極大興趣,並對他的畫法作出了改進,大部分統計軟體也收入了臉譜圖分析法。現在已有很多研究者將該方法套用於實際問題的多變數統計分析中。
臉譜圖分析法的基本思想是由15~18個指針決定臉部特徵,若實際問題變數更多將被忽略(有新的畫圖方法取消了臉的對稱性並引入更多臉部特徵,從而最多可以用36個變數來畫臉譜),若實際問題變數較少則臉部有些特徵將被自動固定。統計學家曾給出了幾種不同的臉譜圖的畫法,而對於同一種臉譜圖的畫法,將變數次序重新排列,得到的臉譜的形狀也會有很大不同。此處我們不對臉譜的各個部位與原始變數的數學關係作出說明,而只給出其作圖的思想及軟體實現方法。
按照H.Chernoff於1973年提出的畫法,採用15個指標,各指標代表的面部特徵為:1表示臉的範圍;2表示臉的形狀;3表示鼻子的長度;4表示嘴的位置;5表示笑容曲線;6表示嘴的寬度;7~11分別表示眼睛的位置、分開程度、角度、形狀和寬度;12表示瞳孔的位置;13~15分別表示眼眉的位置、角度及寬度。這樣,按照各變數的取值,根據一定的數學函式關係,就可以確定臉的輪廓、形狀及五官的部位、形狀,每一個樣本點都用一張臉譜來表示。而臉譜容易給人們留下較為深刻的印象,通過對臉譜的分析,就可以直觀地對原始資料進行歸類或比較研究。
圖2 臉譜法圖2 臉譜法

雷達圖和星圖

雷達圖是目前套用最為廣泛的對多元數據資料進行作圖的方法,利用雷達圖可以很方便地研究各樣本點之間的關係並進而對樣品進行歸類。設要分析的資料共有p個變數,雷達圖的標準畫法如下:先畫一個圓,將圓p等分並由圓點連線各分點,將所得的P條線段作為坐標軸,根據各變數的取值對各坐標軸作適當刻度,這樣,對每個觀測的每個變數的取值,在相應坐標軸上都有一個刻度。對任一樣本點,就可以分別在p個軸上確定其坐標,在各坐標軸上點出其坐標並依次連線p個點,就可以得到一個p邊形,這樣,每一個樣本點就用一個p邊形表示出來,通過觀察各個p邊形的形狀,就可以對各個樣本點的相似性進行分析。當樣本數目較小時,可以在一個圓中畫出所有的樣本點,當樣本數目較大時,也可以每一個樣本點畫一個p邊形進行分析。
S-Plus軟體收入了雷達圖的畫法。EXCEL軟體也提供了畫雷達圖的功能,它適合於觀測數較少的情形,這時可以方便地把各觀測畫到一張圖裡面,便於對各指標進行對比,但是,當觀測數比較多時,畫到一張雷達圖裡面就不太容易看出各觀測之間的接近程度,用EXCEL當然也可以對每一個觀測畫一張雷達圖,但此時轉差率已經很低了。
星圖的形狀與雷達圖很相似,甚至有的文獻把兩者看成一回事。S-Plus軟體可以一次生成多個觀測的星圖,每一個觀測生成一張星圖。
圖3雷達圖圖3雷達圖

星座圖

所謂星座圖,就是將所有樣本點都點在一個半圓裡面,就像天文學中表示的星座的圖
像,根據樣本點的位置直觀地對各樣本點之間的相關性進行分析。利用星座圖可以方便地
對樣本點進行分類,在星座圖上比較靠近的樣本點比較相似,可以分為一類,相距較遠的點
則說明相應樣本點的差異性較大。
星座圖的基本畫圖方法為:
1.先將資料
進行變換,將其取值範圍落到
間,也就是構造函式fj(X),使得
2.對每一變數賦予一個權重wi,滿足:
作圖時,權數的取法,可以採用隨機數的方法產生,也可以取叫
3.畫一個半徑為1的上半圓及底部的直徑,以圓點O為圓心,w1為半徑再畫一個上半
圓,將其弧度為B11的地方記為O1,以O1為圓心畫上半圓,將其弧度為B12的地方記為O2
以此類推,則Op點即為第一個樣本點的位置,同理可以畫出所得資料所有的點。可以看
出,則第k組樣品的星座Zk
Zk的路徑路的
4.根據星座圖上點的位置及路徑判斷各樣本點之問的接近程度,並進而可以對樣本點進行歸類分析。在實際工作中,人們往往去掉各樣本點的路徑部分而僅保留其在星座圖上的位置,並根據各點位置的接近程度分析樣本點之間的接近程度。目前常用的統計軟體均沒有直接生成星座圖的模組,但是,畫星座圖實際上非常簡單。按照上面的方法,對數據進行規格化,對每一個變數賦予適當的權重,然後以(4)式各點的路徑作為在星座圖中的坐標,再畫出各點的散點圖,則畫出的散點圖實際上就是星座圖。這裡不再詳細說明。

相關詞條

熱門詞條

聯絡我們