全球专业中文经管百科,由121,994位网友共同编写而成,共计436,008个条目

单因素方差分析

用手机看条目

出自 MBA智库百科(https://wiki.mbalib.com/)

单因素方差分析(One Way ANOVA)

目录

什么是单因素方差分析

  单因素方差分析是指对单因素试验结果进行分析,检验因素对试验结果有无显著性影响的方法。

  单因素方差分析是两个样本平均数比较的引伸,它是用来检验多个平均数之间的差异,从而确定因素对试验结果有无显著性影响的一种统计方法

单因素方差分析相关概念

  • 因素:影响研究对象的某一指标变量
  • 水平:因素变化的各种状态或因素变化所分的等级或组别。
  • 单因素试验:考虑的因素只有一个的试验叫单因素试验。

单因素方差分析示例[1]

  例如,将抗生素注入人体会产生抗生素与血浆蛋白质结合的现象,以致减少了药效。下表列出了5种常用的抗生素注入到牛的体内时,抗生素与血浆蛋白质结合的百分比。现需要在显著性水平α = 0.05下检验这些百分比的均值有无显著的差异。设各总体服从正态分布,且方差相同。

青霉素四环素链霉素红霉素氯霉素
29.627.35.821.629.2
24.332.66.217.432.8
28.530.811.018.325.0
32.034.88.319.024.2

  在这里,试验的指标是抗生素与血浆蛋白质结合的百分比,抗生素为因素,不同的5种抗生素就是这个因素的五个不同的水平。假定除抗生素这一因素外,其余的一切条件都相同。这就是单因素试验。试验的目的是要考察这些抗生素与血浆蛋白质结合的百分比的均值有无显著的差异。即考察抗生素这一因素对这些百分比有无显著影响。这就是一个典型的单因素试验的方差分析问题。

  与通常的统计推断问题一样,方差分析的任务也是先根据实际情况提出原假设H0与备择假设H1,然后寻找适当的检验统计量进行假设检验。本节将借用上面的实例来讨论单因素试验的方差分析问题。

  在上例中,因素A(即抗生素)有s(=5)个水平A_1,A_2,\cdots,A_5,在每一个水平A_j(j=1,2,\cdots,s)下进行了nj = 4次独立试验,得到如上表所示的结果。这些结果是一个随机变量。表中的数据可以看成来自s个不同总体(每个水平对应一个总体)的样本值,将各个总体的均值依次记为\mu_1,\mu_2,\cdots,\mu_s,则按题意需检验假设

  H_0:\mu_1=\mu_2=\cdots=\mu_s

  H_1:\mu_1,\mu_2,\cdots,\mu_s不全相等

为了便于讨论,现在引入总平均μ

  \mu=\frac{1}{n}\sum_{j=1}^s n_j \mu_j 其中:n=\sum_{j=1}^s n_j

再引入水平Aj的效应δj

\delta_j=\mu_j-\mu,(j=1,2\ldots,s)

显然有n_1\delta_1+n_2\delta_2+\cdots+n_s\delta_s=0δj表示水平Aj下的总体平均值与总平均的差异。

利用这些记号,本例的假设就等价于假设

  H_0:\delta_1=\delta_2=\cdots=\delta_s=0

  H_1:\delta_1,\delta_2,\cdots,\delta_s不全为零

因此,单因素方差分析的任务就是检验s个总体的均值μj是否相等,也就等价于检验各水平Aj的效应δj是否都等于零。

  2. 检验所需的统计量

  假设各总体服从正态分布,且方差相同,即假定各个水平A_j(j=1,2,\cdots,s)下的样本x_{1j},x_{2j},\cdots,x_{n_jj}来自正态总体Nj2)μjσ2未知,且设不同水平Aj下的样本之间相互独立,则单因素方差分析所需的检验统计量可以从总平方和的分解导出来。下面先引入:

  水平Aj下的样本平均值:

  {\overline x}_{\bullet j}=\frac{1}{n}\sum_{i=1}^{n_j}x_{ij}

  数据的总平均:

  \overline{x}=\frac{1}{n}\sum_{j=1}^s\sum_{i=1}^{n_j}x_{ij}=\frac{1}{n}\sum_{j=1}^sn_j{\overline x}_{\bullet j}

  总平方和:

  S_T=\sum_{j=1}^s \sum_{i=1}^{n_j}{(x_{ij}-\overline x)}^2

总平方和ST反映了全部试验数据之间的差异,因此ST又称为总变差。将其分解为

  ST = SE + SA

其中:

  S_E=\sum_{j=1}^s \sum_{i=1}^{n_j}{(x_{ij}\overline x}_{\bullet j})}^2

  S_A=\sum_{j=1}^s \sum_{i=1}^{n_j}{({\overline x}_{\bullet j\overline x)}^2=\sum_{j=1}^s n_j({\overline x}_{\bullet j}-\overline x)^2)

上述SE的各项(x_{ij}\overline x}_{\bullet j})^2表示了在水平Aj下,样本观察值与样本均值的差异,这是由随机误差所引起的,因此SE叫做误差平方和。SA的各项n_j({\overline x}_{\bullet j\overline x)^2表示了在水平Aj下的样本平均值与数据总平均的差异,这是由水平Aj以及随机误差所引起的,因此SA叫做因素A的效应平方和。

  可以证明SASE相互独立,且当H_0:\delta_1=\delta_2=\cdots=\delta_s=0为真时,SASE分别服从自由度为s − 1,nsχ2分布,即

  SA / σ2˜χ2(s − 1)

  SE / σ2˜χ2(ns)

于是,当H_0:\delta_1=\delta_2=\cdots=\delta_s=0为真时

  F=\frac{(S_A)/(s-1)}{(S_E)/(n-s)}=\frac{\frac{S_A}{\sigma^2}/(s-1)}{\frac{S_E}{\sigma^2}/(n-s)} \sim  F(s-1,n-s)

这就是单因素方差分析所需的服从F分布的检验统计量。

  3. 假设检验的拒绝域

  通过上面的分析可得,在显著性水平α下,本检验问题的拒绝域为

  F=\frac{(S_A)/(s-1)}{(S_E)/(n-s)}\le F_{\alpha}(s-1,n-s)

为了方便分析比较,通常将上述分析结果编排成如下表所示的方差分析表。表中的\overline S_A,\overline S_E分别称为SA,SE的均方。

方差来源 平方和自由度均方F比
因素ASAs − 1\overline S_A=\frac{S_A}{s-1}F=\frac{\overline S_A}{\overline S_E}
误差SEns\overline S_E=\frac{S_E}{n-s}
总和STn − 1

参考文献

  1. 赵丹亚,邵丽.中文版Excel2000应用案例.人民邮电出版社,2000年01月第1版
本条目对我有帮助158
MBA智库APP

扫一扫,下载MBA智库APP

分享到:
  如果您认为本条目还有待完善,需要补充新内容或修改错误内容,请编辑条目投诉举报

本条目由以下用户参与贡献

Cabbage,Zfj3000,Vulture,HEHE林,泡芙小姐,Llyn.

评论(共6条)

提示:评论内容为网友针对条目"单因素方差分析"展开的讨论,与本站观点立场无关。
129.34.20.* 在 2012年2月27日 10:20 发表

本文有错误,特别是总变差的公式,组间变差和等,容易误导人。请更正。

回复评论
123.117.34.* 在 2013年5月24日 17:00 发表

最后给出的拒绝域是错误的吧,应该是F>F阿尔法是拒绝域,P值小于显著性水平时也拒绝原假设

回复评论
222.178.202.* 在 2014年12月9日 11:23 发表

好!

回复评论
117.162.193.* 在 2021年5月13日 09:17 发表

统计学太难了

回复评论
183.246.21.* 在 2021年7月5日 20:05 发表

总变差公式错误。此时仍未改正

回复评论
Llyn (Talk | 贡献) 在 2021年7月6日 09:41 发表

183.246.21.* 在 2021年7月5日 20:05 发表

总变差公式错误。此时仍未改正

我看了下,稍微修改了,如果你还发现别的错误,欢迎直接修改编辑!

回复评论

发表评论请文明上网,理性发言并遵守有关规定。

打开APP

以上内容根据网友推荐自动排序生成

下载APP

闽公网安备 35020302032707号