單因素方差分析
出自 MBA智库百科(https://wiki.mbalib.com/)
單因素方差分析(One Way ANOVA)
目錄 |
單因素方差分析是指對單因素試驗結果進行分析,檢驗因素對試驗結果有無顯著性影響的方法。
單因素方差分析是兩個樣本平均數比較的引伸,它是用來檢驗多個平均數之間的差異,從而確定因素對試驗結果有無顯著性影響的一種統計方法。
單因素方差分析示例[1]
例如,將抗生素註入人體會產生抗生素與血漿蛋白質結合的現象,以致減少了藥效。下表列出了5種常用的抗生素註入到牛的體內時,抗生素與血漿蛋白質結合的百分比。現需要在顯著性水平α = 0.05下檢驗這些百分比的均值有無顯著的差異。設各總體服從正態分佈,且方差相同。
青黴素 | 四環素 | 鏈黴素 | 紅黴素 | 氯黴素 |
29.6 | 27.3 | 5.8 | 21.6 | 29.2 |
24.3 | 32.6 | 6.2 | 17.4 | 32.8 |
28.5 | 30.8 | 11.0 | 18.3 | 25.0 |
32.0 | 34.8 | 8.3 | 19.0 | 24.2 |
在這裡,試驗的指標是抗生素與血漿蛋白質結合的百分比,抗生素為因素,不同的5種抗生素就是這個因素的五個不同的水平。假定除抗生素這一因素外,其餘的一切條件都相同。這就是單因素試驗。試驗的目的是要考察這些抗生素與血漿蛋白質結合的百分比的均值有無顯著的差異。即考察抗生素這一因素對這些百分比有無顯著影響。這就是一個典型的單因素試驗的方差分析問題。
與通常的統計推斷問題一樣,方差分析的任務也是先根據實際情況提出原假設H0與備擇假設H1,然後尋找適當的檢驗統計量進行假設檢驗。本節將借用上面的實例來討論單因素試驗的方差分析問題。
在上例中,因素A(即抗生素)有s(=5)個水平,在每一個水平下進行了nj = 4次獨立試驗,得到如上表所示的結果。這些結果是一個隨機變數。表中的數據可以看成來自s個不同總體(每個水平對應一個總體)的樣本值,將各個總體的均值依次記為,則按題意需檢驗假設
不全相等
為了便於討論,現在引入總平均μ
其中:
再引入水平Aj的效應δj
顯然有,δj表示水平Aj下的總體平均值與總平均的差異。
利用這些記號,本例的假設就等價於假設
不全為零
因此,單因素方差分析的任務就是檢驗s個總體的均值μj是否相等,也就等價於檢驗各水平Aj的效應δj是否都等於零。
2. 檢驗所需的統計量
假設各總體服從正態分佈,且方差相同,即假定各個水平下的樣本來自正態總體N(μj,σ2),μj與σ2未知,且設不同水平Aj下的樣本之間相互獨立,則單因素方差分析所需的檢驗統計量可以從總平方和的分解導出來。下麵先引入:
水平Aj下的樣本平均值:
數據的總平均:
總平方和:
總平方和ST反映了全部試驗數據之間的差異,因此ST又稱為總變差。將其分解為
ST = SE + SA
其中:
上述SE的各項表示了在水平Aj下,样本观察值与样本均值的差异,这是由随机误差所引起的,因此SE叫做误差平方和。SA的各项表示了在水平Aj下的樣本平均值與數據總平均的差異,這是由水平Aj以及隨機誤差所引起的,因此SA叫做因素A的效應平方和。
可以證明SA與SE相互獨立,且當為真時,SA與SE分別服從自由度為s − 1,n − s的χ2分佈,即
SA / σ2˜χ2(s − 1)
SE / σ2˜χ2(n − s)
於是,當為真時
這就是單因素方差分析所需的服從F分佈的檢驗統計量。
3. 假設檢驗的拒絕域
通過上面的分析可得,在顯著性水平α下,本檢驗問題的拒絕域為
為了方便分析比較,通常將上述分析結果編排成如下表所示的方差分析表。表中的分別稱為SA,SE的均方。
方差來源 | 平方和 | 自由度 | 均方 | F比 |
因素A | SA | s − 1 | ||
誤差 | SE | n − s | ||
總和 | ST | n − 1 |
- ↑ 趙丹亞,邵麗.中文版Excel2000應用案例.人民郵電出版社,2000年01月第1版
本文有錯誤,特別是總變差的公式,組間變差和等,容易誤導人。請更正。