組距式變數數列
出自 MBA智库百科(https://wiki.mbalib.com/)
組距式變數數列( Class Interval Series)
目錄 |
組距式變數數列簡稱組距數列,是指在變數數列中的每一個組,並不是由一個變數值來表示,而是由表明一定變動範圍或表示一定距離的兩個變數值所形成的數列。
組距式變數數列又可分為:等距式數列與不等距式數列;開口式數列與封閉式數列等。
在編製過程中,要正確處理的具體問題。
①組數與組距
編製組距數列,必須對總體進行分組,針對一個總體,應將其分為多少組,這要根據研究的目的來確定,同時要本著以能簡單明瞭地反映問題為原則。如果組數過多,必然會造成總體單位分佈分散,同時還有可能把屬於同類的單位歸到不同的組中,不能真實反映出事物的本質特點和規律性;如果組數過少,又會造成把不同性質的單位歸到同一個組內,失去區別事物的界限,達不到正確反映客觀事實的目的。因此,必須恰當地確定組數。美國學者斯特奇斯 (HASturges)提出,在總體各單位標誌值分佈趨於正態的情況下,可根據總體單位數(N)來確定應分組數(n),公式為:
n=1+3.322lgN
上式可供分組時參考,但也不能生搬硬套。當總體單位數過少時,按上述公式計算的組數可能偏多;而當總體單位數很多時,計算的組數又可能偏少。
確定組數後,還應確定組距。組數和組距之間存在著密切關係。在全距(最大變數值與最小變數值之差)一定的情況下,組距的大小和標誌變數數列的全距大小成正比變化,與組數多少成反比變化。
組數越多,組距越小;組數越少,組距越大。由於組距數列有等距數列與異距數列之分,在採用等距分組的情況下,變數數列編製的組距(d)可採用下列公式確定:
組距數列中,每個組都有兩個端點,這兩個端點稱為組限。數值小的端點稱為組的下限,數值大的端點稱為組的上限。
若一組內有上限缺下限,或有下限缺上限稱為開口組;
若一組內的上限、下限都齊全稱為閉口組。
組距數列掩蓋了組內各單位的實際變數值,通常用組中值近似地代替每組變數值的一般水平。
註意:用組中值來代表各組的一般水平時,變數值在該組應呈均勻分佈,或在組中值兩側呈對稱分佈,否則,用組中值作為一組的代表值會有一定的誤差。
好好