基本內容
單項分組:將變數的不同取值作為一組的組別,變數有多少個不同的取值就劃分為多少組。
組距分組:將變數的全部取值按照其大小的順序劃分成若干個不同數值的區間。連續型變數,或取值較多的離散型變數採用組距分組。
集中趨勢:指總體中各單位的次數分布從兩邊向中間集中的趨勢,用平均指標來反映。
離散趨勢:指分配數列中各標誌值遠離中心值(即平均數)的程度,或總體各單位變數值間的差異程度,也稱離散程度或離中趨勢。
分類
變數數列分為
單項式變數數列和
組距式變數數列,也可簡稱為單項數列和
組距數列。
1.單項變數數列
單項變數數列,是指在變數數列中的每一個組,只用一個變數值來表示所形成的數列。單項變數數列的套用受到一定的限制,一般僅適用於數列變異幅度不太大的情況;如果數列的變異範圍很大,就要採用組距數列。
2.組距數列
組距數列,是指在變數數列中的每一個組,並不是由一個變數值來表示,而是由表明一定變動範圍或表示一定距離的兩個變數值所形成的數列。
編制過程
1.確定組數
組距分組的組數通常選取在5-20組之間;變數值變化不均勻應採用異距分組;變數值變化均勻應採用等距分組;等距分組便於比較和分析處理,實踐中應儘量採用等距分組確定組距。
2.確定組距
一般用公式
計算出的值為組距的最小值,在實際分組中,為了使全部變數值都能有組可入,實際的組距只能比此值大。
3.確定組限
組限應儘量採用整數,特別是5和10的倍數。離散型變數鄰組的上下限可以不用同一個數值,連續型變數鄰組的上下限必須用同一個數值。
鄰組的上下限為同一數值時,約定:上限不包含在本組之內,稱為上限不在內原則。
4.計算各組的次數(頻數)
5.編制變數數列
編制說明
關於編制變數數列,還有以下各點需要說明:
1.變數有
連續變數與非連續變數之分。所謂連續變數,就是在一個變數數列中,相鄰的兩個變數值都是連續不斷的,如產值、產量、貿易額等,都可以用小數來表示的變數;所謂非連續變數,就是在一個變數數列中,相鄰的兩個變數值都是可以間斷的,如職工人數、工廠數、商店數、機器台數等,這些變數都只能用整數來表示。
用連續變數來編制的
組距數列,不論是等距數列,還是異距數列,上一組的下限與相鄰下一組的上限可以重合。
2.在
組距數列中,凡出現“以下”、“以上”字樣的組叫
開口組,這樣的變數數列就叫做開口式數列。習慣上是以相鄰組的組距為組距。
3、在編制異距數列時,組數和組距應根據現象的特點來確定;而在編制等距數列時,便要經常編制組距為5或10的等距數列。這時,確定組數和組距的經驗作法是:將
總體單位某一
數量標誌的最大值減去最小值算出
全距,然後除以10或5,即可算出組數和組距來。例如,某外貿企業有職工300人,最高的工資為106元,最低的工資為30元,其全距為76,假如每隔10為一組,則可算出組數為8組,於是將全部職工人數分在30—40,40—50,⋯100—110 等八個組中去,便可編制出以
組距為10的等距數列。
測度分析
集中趨勢的測度
測定集中趨勢的意義:可以反映現象總體的客觀規定性;可以對比同類現象在不同的時間、地點和條件下的一般水平;可以分析現象之間的依存關係。
平均指標的種類及計算方法
算術平均數適用於總體資料未經分組整理、尚為原始資料的情況。
調和平均數是總體各單位標誌值倒數的算術平均數的倒數,又叫倒數平均數。簡單調和平均數適用於總體資料未經分組整理、尚為原始資料的情況;加權調和平均數適用於總體資料經過分組整理形成變數數列的情況。
幾何平均數適用於計算現象的平均比率或平均速度。簡單幾何平均數適用於總體資料未經分組整理尚為原始資料的情況;加權幾何平均數適用於總體資料經過分組整理形成變數數列的情況。
中位數是指將總體各單位標誌值按大小順序排列後,指處於數列中間位置的標誌值。不受極端數值的影響,在總體標誌值差異很大時,具有較強的代表性。
眾數是指總體中出現次數最多的變數值,它不受極端數值的影響,用來說明總體中大多數單位所達到的一般水平。
離散趨勢的測度
離散趨勢用
標誌變異指標來反映。變異指標值越大,平均指標的代表性越小;反之,平均指標的代表性越大。
測定離散趨勢的意義:用來衡量和比較平均數代表性的大小;用來反映社會經濟活動過程的均衡性和節奏性;用來總體標誌值分布較常態分配的偏離程度。
標誌變異指標的種類及計算
極差指所研究的數據中,最大值與最小值之差,又稱全距。優點:計算方法簡單、易懂;缺點:易受極端數值的影響,不能全面反映所有標誌值差異大小及分布狀況,準確程度差。往往套用於生產過程的質量控制中。
平均差是各個數據與其算術平均數的離差絕對值的算術平均數。優點:不易受極端數值的影響,能綜合反映全部單位標誌值的實際差異程度;缺點:用絕對值的形式消除各標誌值與算術平均數離差的正負值問題,不便於作數學處理和參與統計分析運算。一般情況下都是通過計算另一種標誌變異指標——標準差,來反映總體內部各單位標誌值的差異狀況。
標準差是各個數據與其算術平均數的離差平方的算術平均數的開平方根。不易受極端數值的影響,能綜合反映全部單位標誌值的實際差異程度;用平方的方法消除各標誌值與算術平均數離差的正負值問題,可方便地用於數學處理和統計分析運算。
變異係數指標用來對比不同水平的同類現象,特別是不同類現象總體平均數代表性的大小。