統計描述

描述內容

主要包括平均指標和變異指標的計算、資料分布形態（或特徵）的圖形表現等。

統計功能

指標計算

描述性統計指標的計算可以用四個不同的過程來實現，它們分別是means過程、summary過程、univariate過程以及tabulate過程。它們在功能範圍和具體的操作方法上存在一定的差別，下面我們大概了解一下它們的異同點。

相同點：

他們均可計算出均數、標準差、方差、標準誤、總和、加權值的總和、最大值、最小值、全距、校正的和未校正的離差平方和、變異係數、樣本分布位置的t檢驗統計量、遺漏數據和有效數據個數等，均可套用by語句將樣本分割為若干個更小的樣本，以便分別進行分析。不同點：

（1）means過程、summary過程、univariate過程可以計算樣本的偏度（skewness）和峰度（kurtosis），而tabulate過程不計算這些統計量；

（2）univariate過程可以計算出樣本的眾數（mode），其它三個過程不計算眾數；

（3）summary過程執行後不會自動給出分析的結果，須引用output語句和print過程來顯示分析結果，而其它三個過程則會自動顯示分析的結果；

（4）univariate過程具有統計製圖的功能，其它三個過程則沒有；

（5）tabulate過程不產生輸出資料檔案（存儲各種輸出數據的檔案），其它三個均產生輸出資料檔案。

以上是它們的主要異同點，其它更為具體的異同點需要在實際套用中去體會。掌握了各種過程的異同點，就可以根據具體需要選擇最佳的過程進行工作。

統計製圖

統計製圖的過程均可以實現對樣本分布特徵的圖形表示，一般情況下可以使用的有chart過程、plot過程、gchart過程和gplot過程。大家有沒有發現前兩個和後兩個只有一個字母‘g’（代表graph）的差別，其實它們之間（只差一個字母g的過程之間）的統計描述功能是相同的，區別僅在於繪製出的圖形的複雜和美觀程度。

chart過程和plot過程繪製的圖形類似於我們用文本字元堆積起來的圖形，只能概括地反映出資料分布的大體形狀，實際上這兩個過程繪製的圖形並不能稱之為圖形，因為他根本就沒有涉及一般意義上圖形的任何一種元素（如顏色、解析度等）。

而gchart過程和gplot過程給出的是真正意義上的圖形，可以用很多的語句和選項來控制圖形的各方面的性質和特徵。

chart和gchart與plot和gplot的區別則體現在不同的作圖功能，前兩個過程可以繪製出的圖形主要有條形圖（包括橫條和豎條）、圓圖、環形圖和星形圖等，後兩個過程通常用一個記錄中的兩個變數值表示點的坐標來繪製圖形，如散點圖和線圖等。

圖形關鍵字	繪製的圖形類型	圖形關鍵字	繪製的圖形類型
block	方塊圖	pie	圓圖
hbar	水平的條形圖	pie3d	三維圓圖
hbar3d	水平的三維條形圖	donut	環形圖
vbar	豎立的條形圖	star	星形圖
vbar3d	豎立的三維條形圖

關鍵字	所代表的含義
n	有效數據記錄數
nmiss	缺失數據記錄數
mean	均數
std	標準差
stderr	標準誤
var	方差
median	中位數
mode	眾數
cv	變異係數
max	最大值
min	最小值
range	全距
sum	總計
sumwgt	加權值總計
css	校正的離均差平方和
uss	未校正的離均差平方和
clm	可信限（上下界值）
lclm	可信限下側界值
uclm	可信限上側界值
skew（skewness）	偏度
kurt（kurtosis）	峰度
t	分布位置假設檢驗之t統計量
probt	上述t統計量對應的機率值
q1	第一四分位數
q3	第三四分位數
qrange	四分位數間距
p1	第一百分位數
p5	第五百分位數
p10	第十百分位數
p90	第九十百分位數
p95	第九十五百分位數
p99	第九十九百分位數

統計描述

基本介紹

描述內容

統計功能

指標計算

統計製圖

一般格式

統計關鍵

相關詞條

熱門詞條