等距分組
出自 MBA智库百科(https://wiki.mbalib.com/)
目錄 |
等距分組是各組保持相等的組距,也就是說各組標誌值的變動都限於相同的範圍。
在等距分組中,各組單位數的多少不會受到組距大小的影響,便於直接比較各組次數的多少,研究次數分佈的特征。因此,等距分組是組距分組的基本方法。
1、計算取值範圍
取值範圍(Value Area)為全體數據中最大數值與最小數值之差,反映了該組數值變數取值的變動幅度,一般用R表示,有
R=max{X}-min{X} (1)
2、確定組數
在進行數值型數據分組時,有一個計算組數的經驗公式,即
(2)
由於組數是個只能取整數的離散變數,一般取式(2)的四捨五入數值作為組數的參考數值。例如,當數據的總數N為80時,採用經驗公式計算出組數為,可考慮將該組數分為7組。
確定組數的目的是為了使數據恰當地分佈在各組中,數據過於集中和過於分散都有礙於對數據分佈特征的展示,不利於後續的分析研究,計算組數的經驗公式正是從這個角度出發,總結出的一個根據待分組數據的多少計算組數的具體方法。但是,經驗公式計算出來的組數只是一個參考數值,組距的確定還要根據研究對象的實際情況,具體問題具體分析,因地制宜地加以確定。例如,在考試成績的分析中,人們習慣將其分為優、良、中、及格和不及格5組,不論數據個數多少,分成這樣5組較為適宜。
3、計算組距
由於取值範圍是客觀存在的,當組數確定之後,組距也就隨之確定了,兩者成反比例關係。設H為組數,d為組距,即有組距d=R/H。為了便於數據分組和組限的劃定,組距一般取5,10的整數倍。
4、確定組限
確定組限就是具體規定各組中變數可能取值的上限和下限。確定組限的原則是“不重不漏”,使每一數據都能夠被分配到其中一組裡,並且只能分配到其中一組裡。組限的具體形式有間斷組限和重合組限,閉口組限和開口組限。
間斷組限是每一組的組限與鄰組的組限都是間斷設置的。重合組限是每一組的組限與鄰組的組限都是相互重疊設置的。
閉口組限是既有上限又有下限的組限設置。由閉口組限設置形成的數據分組稱為閉口組。開口組限是缺少上限或者缺少下限的組限設置。由開口組限設置形成的數據分組稱為開口組。開口組限用於組距的上下兩端的組限設置,即最高數值和最低數值組的組限設置。當繼續採用相等的組距進行分組,落在上下兩端的分組中的數據明顯過少,不具有單獨分析價值時,通常採用開口組限設置。