曼-惠特尼U检验

出自 MBA智库百科(http://wiki.mbalib.com/)

曼-惠特尼U检验(Mann-Whitney U test)

目录

什么是曼-惠特尼U检验

  曼-惠特尼U检验又称“曼-惠特尼秩和检验”,是由H.B.MannD.R.Whitney于1947年提出的。它假设两个样本分别来自除了总体均值以外完全相同的两个总体,目的是检验这两个总体的均值是否有显著的差别。

  曼-惠特尼秩和检验可以看作是对两均值之差的参数检验方式的T检验或相应的大样本正态检验的代用品。由于曼-惠特尼秩和检验明确地考虑了每一个样本中各测定值所排的秩,它比符号检验法使用了更多的信息。

曼-惠特尼U检验的步骤

Computation of the U test begins by arbitrarily designating two samples as group 1 and group 2.the data from the two groups are combined into one group ,with each data value retaining a group identifier of its original group.the pooled values are then ranked from 1 to n,with the smallest value being assigned a rank of 1.

The sum of the ranks of Values from group 1 is computed and designated as W1 and the sum of the ranks of values from group 2 is designated as W2.[1]

  该方法的具体步骤如下:

  第一步:将两组数据混合,并按照大小顺序编排等级。最小的数据等级为1,第二小的数据等级为2,以此类推(若有数据相等的情形,则取这几个数据排序的平均值作为其等级)。

  第二步:分别求出两个样本的等级和W1W2

  第三步:计算曼-惠特尼U检验统计量,n1为第一个样本的量,n2为第二个样本的量:

U_1=n_1n_2+\frac{n_1(n_1+1)}{2}-W_1
U_2=n_1n_2+\frac{n_2(n_2+1)}{2}-W_2

  选择U1U2中最小者与临界值Uα比较,当U < UA时,拒绝H0,接受H1

  在原假设为真的情况下,随机变量U的均值和方差分别为:

  E(U)=\frac{n_1n_2}{2}  D(U)=\frac{n_1n_2(n_1+n_2+1)}{12}

  当n1n2都不小于10时,随机变量近似服从正态分布。

  第四步:作出判断。

  设第一个总体的均值为μ1,第二个总体的均值为μ2,则有:

  1)H_0:\mu_1\le\mu_2,H_1:\mu_1>\mu_2,如果Z < − Zα,则拒绝H0

  2)H_0:\mu_1\ge\mu_2,H_1:\mu_1<\mu_2,如果Z > Zα,则拒绝H0

  3)H_0:\mu_1=\mu_2,H_1:\mu_1\ne\mu_2,如果Z > − Zalpha / 2,则拒绝H0

曼-惠特尼U检验的应用举例

  下面是两种不同加工方式的菜粕在黄牛瘤胃内培养16h的干物质降解率,用曼-惠特尼U检验比较其有无差异:

      两种加工方式的菜粕瘤胃培养16h的干物质降解率(%)

预压浸出组等级排序螺旋热榨组等级排序
39.33342.915
44.10844.6910
35.89144.549
43.35645.3111
47.611337.732
43.71748.7514
46.7112
41.854

  先按照大小顺序排列等级(见上表),而后计算W1 = 38,W2 = 67,n1 = 6,n2 = 8

  假设两种菜粕的16h瘤胃干物质降解率除了平均水平以外在其它方面无差异,即检验:

H0:两种菜粕的16h瘤胃干物质降解率无差异;
H1:两种菜粕的16h瘤胃干物质降解率有差异。

  计算U值:

U_1=6\times 8+\frac{6\times 7}{2}-38=31
U_2=6\times 8+\frac{8\times 9}{2}-67=17

  U2值较小,选取U2Uα(α=0.05)比较,通过查表(附表)可知Uα = 8,U2 > Uα,即接受H0,认为两种加工方式的菜粕瘤胃培养16h的干物质降解率无显著差异。

  附表:

            曼-惠特尼检验U的临界值表

      (仅列出单侧检验在0.025或双侧检验在0.05处的U临界值)

n2123456789101112131415
n1               
1             
2       00001111
3    01122334455
4   0123445678910
5  01235678911121314
6  12356810111314161719
7  135681012141618202224
8 02468101315171922242629
9 024710121517202326283134
10035811141720232629333639
11036913161923263033374044
121471114182226293337414549
131481216202428333741455054
141591317222631364045505559
1515101419242934394449545964

参考文献

  1. Ken Black.Business Statistics: Contemporary Decision Making.John Wiley and Sons, 2009.ISBN:0470409010, 9780470409015
本条目对我有帮助34
分享到:
  如果您认为本条目还有待完善,需要补充新内容或修改错误内容,请编辑条目

本条目由以下用户参与贡献

Zfj3000,Angle Roh.

评论(共10条)

提示:评论内容为网友针对条目"曼-惠特尼U检验"展开的讨论,与本站观点立场无关。
203.177.74.* 在 2009年1月14日 08:29 发表

很详细, 谢谢!

回复评论
124.17.118.* 在 2009年6月10日 21:30 发表

xiexie

回复评论
218.94.137.* 在 2009年12月7日 14:28 发表

非常感谢。

回复评论
118.251.248.* 在 2010年3月6日 14:17 发表

W1和W2是什么?

回复评论
Hnoju (Talk | 贡献) 在 2010年3月6日 15:33 发表

118.251.248.* 在 2010年3月6日 14:17 发表

W1和W2是什么?

已在原文做了补充

回复评论
93.34.136.* 在 2010年6月28日 04:00 发表

谢谢,非常好的资料,但是如果第三步通过U的临界值能判断的话,为什么还要有第四步判断过程?

回复评论
202.116.70.* 在 2010年11月26日 00:32 发表

我也跟楼上有同样的疑惑,感觉到第三步就应该完了吧,如果拒绝了H0,接收H1,就说明两序列差异明显。如果接受H0,就表明两序列差异不明显。整个过程就应该完了啊。

回复评论
202.116.70.* 在 2010年11月26日 01:46 发表

上面那个方法是对n1和n2都小于或等于10的情况下的计算方法,但是大部分时候n1和n2都是大于10的。这时候上面那个方法就行不通了,需要另外一种,上面没有讲全。

回复评论
Dan (Talk | 贡献) 在 2010年11月26日 10:25 发表

202.116.70.* 在 2010年11月26日 01:46 发表

上面那个方法是对n1和n2都小于或等于10的情况下的计算方法,但是大部分时候n1和n2都是大于10的。这时候上面那个方法就行不通了,需要另外一种,上面没有讲全。

MBA智库百科是可以自由参与的百科,如有发现错误和不足,您也可以参与修改编辑,期待您的加入!

回复评论
219.234.81.* 在 2011年1月2日 16:15 发表

有讲解有实例,很好啊!

回复评论

发表评论请文明上网,理性发言并遵守有关规定。