T检验

出自 MBA智库百科(http://wiki.mbalib.com/)

T检验(T Test)

目录

什么是T检验

  T检验,亦称student t检验(Student's t test),主要用于样本含量较小(例如n<30),总体标准差σ未知的正态分布资料。

  T检验是用于小样本(样本容量小于30)的两个平均值差异程度的检验方法。它是用T分布理论来推断差异发生的概率,从而判定两个平均数的差异是否显著。

  T检验是戈斯特为了观测酿酒质量而发明的。戈斯特在位于都柏林的健力士酿酒厂担任统计学家。戈特特于1908年在Biometrika上公布T检验,但因其老板认为其为商业机密而被迫使用笔名(学生)。

  T检验的适用条件:正态分布资料

单个样本的t检验

  目的:比较样本均数 所代表的未知总体均数μ和已知总体均数μ0

  计算公式:

  t统计量:t=\frac{|\overline{X}-\mu_0|}{S_{\overline{X}}}=\frac{\bar{X}-\mu_0}{s/\sqrt{n}}

  自由度:v=n - 1

  适用条件:

  (1) 已知一个总体均数;

  (2) 可得到一个样本均数及该样本标准误;

  (3) 样本来自正态或近似正态总体。

单个样本的t检验实例分析[1]

  例1 难产儿出生体重 n=35,\bar{X}=3.42,  S=0.40,

  一般婴儿出生体重μ0 = 3.30(大规模调查获得),问相同否?

  解:1.建立假设、确定检验水准α

  H0:μ = μ0 (无效假设,null hypothesis)

  H_1:\mu\ne\mu_0(备择假设,alternative hypothesis,)

  双侧检验,检验水准:α = 0.05

   2.计算检验统计量

  t=\frac{\bar{X}-\mu_0}{S/\sqrt{n}}=\frac{3.42-3.30}{0.40/\sqrt{35}}=1.77, v=n-1=35-1=34

  3.查相应界值表,确定P值,下结论

  查附表1: t0.05 / 2.34 = 2.032,t = 1.77,t < t0.05 / 2.34,P > 0.05,α = 0.05水准,不拒绝H0,两者的差别无统计学意义

  

配对样本t检验

  配对设计:将受试对象的某些重要特征按相近的原则配成对子,目的是消除混杂因素的影响,一对观察对象之间除了处理因素/研究因素之外,其它因素基本齐同,每对中的两个个体随机给予两种处理。

  • 两种同质对象分别接受两种不同的处理,如性别、年龄、体重、病情程度相同配成对。
  • 同一受试对象或同一样本的两个部分,分别接受两种不同的处理
  • 自身对比。即同一受试对象处理前后的结果进行比较。

  目的:判断不同的处理是否有差别

  计算公式及意义:

  t 统计量t=\frac{\bar{d}}{S_d/\sqrt{n}}

  自由度:v=对子数-1

  适用条件:配对资料

T检验的步骤

  1、建立虚无假设H01 = μ2,即先假定两个总体平均数之间没有显著差异;

  2、计算统计量T值,对于不同类型的问题选用不同的统计量计算方法;

  1)如果要评断一个总体中的小样本平均数与总体平均值之间的差异程度,其统计量T值的计算公式为:

  T=\frac{\bar{X}-\mu_0}{\frac{S}{n-1}}

  2)如果要评断两组样本平均数之间的差异程度,其统计量T值的计算公式为:

  T=\frac{\bar{X}_1-\bar{X}_2}{\sqrt{\frac{\sum x_1^2+\sum x_2^2}{n_1+n_2-2}}\times\frac{n_1+n_2}{n_1\times n_2}}

  3、根据自由度df=n-1,查T值表,找出规定的T理论值并进行比较。理论值差异的显著水平为0.01级或0.05级。不同自由度的显著水平理论值记为T(df)0.01和T(df)0.05

  4、比较计算得到的t值和理论T值,推断发生的概率,依据下表给出的T值与差异显著性关系表作出判断。

T值与差异显著性关系表
TP值差异显著程度
T\ge T(df)0.01P\le 0.01差异非常显著
T\ge T(df)0.05P\le 0.05差异显著
T < T(df)0.05P > 0.05差异不显著

  5、根据是以上分析,结合具体情况,作出结论。

T检验举例说明

  例如,T检验可用于比较药物治疗组与安慰剂治疗组病人的测量差别。理论上,即使样本量很小时,也可以进行T检验。(如样本量为10,一些学者声称甚至更小的样本也行),只要每组中变量呈正态分布,两组方差不会明显不同。如上所述,可以通过观察数据的分布或进行正态性检验估计数据的正态假设。方差齐性的假设可进行F检验,或进行更有效的Levene's检验。如果不满足这些条件,只好使用非参数检验代替T检验进行两组间均值的比较。

  T检验中的P值是接受两均值存在差异这个假设可能犯错的概率。在统计学上,当两组观察对象总体中的确不存在差别时,这个概率与我们拒绝了该假设有关。一些学者认为如果差异具有特定的方向性,我们只要考虑单侧概率分布,将所得到t-检验的P值分为两半。另一些学者则认为无论何种情况下都要报告标准的双侧T检验概率。

  1、数据的排列

  为了进行独立样本T检验,需要一个自(分组)变量(如性别:男女)与一个因变量(如测量值)。根据自变量的特定值,比较各组中因变量的均值。用T检验比较下列男、女儿童身高的均值。

性别身高
对象1
对象2
对象3
对象4
对象5
男性
男性
男性
女性
女性
111
110
109
102
104
男性身高均数 = 110
女性身高均数 = 103

  2、T检验图

  在T检验中用箱式图可以直观地看出均值与方差的比较,见下图:

T检验

  这些图示能够很快地估计并且直观地表现出分组变量与因变量关联的强度。

  3、多组间的比较

  科研实践中,经常需要进行两组以上比较,或含有多个自变量并控制各个自变量单独效应后的各组间的比较,(如性别、药物类型与剂量),此时,需要用方差分析进行数据分析,方差分析被认为是T检验的推广。在较为复杂的设计时,方差分析具有许多t-检验所不具备的优点。(进行多次的T检验进行比较设计中不同格子均值时)。

T检验注意事项

  • 要有严密的抽样设计随机、均衡、可比
  • 选用的检验方法必须符合其适用条件(注意:t检验的前提是资料服从正态分布)
  • 单侧检验和双侧检验

  单侧检验的界值小于双侧检验的界值,因此更容易拒绝,犯第Ⅰ错误的可能性大。

  • 不能拒绝H0,有可能是样本数量不够拒绝H0 ,有可能犯第Ⅰ类错误
  • 正确理解P值与差别有无统计学意义

  P越小,不是说明实际差别越大,而是说越有理由拒绝H0 ,越有理由说明两者有差异,差别有无统计学意义和有无专业上的实际意义并不完全相同

  • 结论具有一致性
  • 差异:提供的信息不同

  区间估计给出总体均值可能取值范围,但不给出确切的概率值,假设检验可以给出H0成立与否的概率

参考文献

  1. 宇传华.医疗等本科班《医学统计学》第三章 两组资料均数的比较2 2010.12.1
本条目对我有帮助233
分享到:
  如果您认为本条目还有待完善,需要补充新内容或修改错误内容,请编辑条目

本条目由以下用户参与贡献

Zfj3000,001,苦行者,Angle Roh,Kane0135,Vulture,Zorji,Yixi.

评论(共45条)

提示:评论内容为网友针对条目"T检验"展开的讨论,与本站观点立场无关。
59.172.218.* 在 2008年5月17日 09:56 发表

看不懂,有好多字母代表了什么东西都没写出来, 如X等某些词。。。 这对外人来说都是不可理解的。

回复评论
220.249.99.* 在 2008年5月24日 17:06 发表

看不懂,有好多字母代表了什么东西都没写出来, 如X等某些词。。。这对外人来说都是不可理解的。 只能说你太外行了。

回复评论
219.131.18.* 在 2008年6月5日 15:53 发表

我越看越糊涂,一头雾水

回复评论
134.76.63.* 在 2008年6月13日 19:38 发表

最好看看假设检验相关的材料,从几种分布到置信区间一路看过来,用不了几天就可以明白了,东西不难。但是要会应用。

回复评论
125.90.58.* 在 2008年6月18日 13:04 发表

谢谢 o(∩_∩)o...

回复评论
121.8.43.* 在 2008年7月5日 15:36 发表

good~thx

回复评论
58.213.116.* 在 2008年7月9日 14:46 发表

很好 说的很详细啊 谢谢

回复评论
211.31.87.* 在 2008年11月3日 08:29 发表

写的很好,谢谢

回复评论
221.2.163.* 在 2008年11月3日 16:53 发表

Thank you.

回复评论
59.45.74.* 在 2008年11月16日 18:05 发表

very good

回复评论
128.240.229.* 在 2008年11月24日 06:11 发表

非常好~~

回复评论
220.192.227.* 在 2008年11月25日 08:07 发表

好!深入浅出,点到为止,好!

回复评论
68.31.46.* 在 2009年1月12日 06:50 发表

7年前学的统计,现在老婆让我教她,只好上网恶补。文章总结得很好,尤其是还有例子,太感谢了!

回复评论
202.150.55.* 在 2009年1月29日 15:20 发表

看不懂,有好多字母代表了什么东西都没写出来, 如X等某些词。。。这对外人来说都是不可理解的。

回复评论
159.226.234.* 在 2009年2月16日 15:53 发表

很好。谢谢

回复评论
202.106.132.* 在 2009年6月23日 10:19 发表

没看到T检验的举例

回复评论
141.219.57.* 在 2009年11月20日 03:54 发表

very nice... it would be much better if you have a pair sample t-test.

回复评论
125.77.231.* 在 2009年12月15日 10:15 发表

terrific, thanks a lot.

回复评论
220.248.225.* 在 2009年12月22日 19:42 发表

谢了!!!

回复评论
116.16.61.* 在 2010年1月28日 00:18 发表

中文的看着晕....

回复评论
86.181.199.* 在 2010年3月21日 23:20 发表

感谢啊~

回复评论
113.251.160.* 在 2010年3月23日 14:33 发表

呵呵,不错,通俗易懂~~

回复评论
124.90.203.* 在 2010年5月15日 15:10 发表

thank you

回复评论
122.96.83.* 在 2010年5月18日 21:41 发表

查附表1: t0.05 / 2.34 = 2.032,t = 1.77,t < t0.05 / 2.34, P > 0.05,按α=0.05水准,不拒绝H0,两者的差别无统计学意义 LZ 的意思是不是 T0.05/2(34)=2.032!,下同

回复评论
61.154.122.* 在 2010年7月14日 15:54 发表

X—是平均数啊。。。这是基础知识啊。。 楼上说字母是啥意思的。。。也太外行了吧。。。。

回复评论
117.27.27.* 在 2010年9月8日 15:19 发表

非常好!!

回复评论
183.14.47.* 在 2010年9月12日 00:41 发表

very good

回复评论
58.16.41.* 在 2010年9月19日 22:46 发表

解释的挺好,十分感谢!

回复评论
64.238.165.* 在 2010年9月30日 22:10 发表

应该先去看ho h1假设 再看t test 不过这个写的不错 我通过例子看懂了

回复评论
221.226.44.* 在 2010年11月8日 18:43 发表

看不太懂

回复评论
114.255.218.* 在 2010年11月16日 20:58 发表

很详细

回复评论
58.62.42.* 在 2010年11月21日 14:30 发表

只能说声谢谢了! 比别的地方好多了,清楚得很!

回复评论
113.142.17.* 在 2010年12月1日 09:19 发表

第一个t的公式是不是有问题啊,错把n写为x了,好像…

回复评论
Yixi (Talk | 贡献) 在 2010年12月1日 15:58 发表

113.142.17.* 在 2010年12月1日 09:19 发表

第一个t的公式是不是有问题啊,错把n写为x了,好像…

感谢您的指正,原文已修正,并增加了新的内容,谢谢您的参与。

回复评论
27.17.178.* 在 2010年12月22日 00:59 发表

不错。

回复评论
218.26.243.* 在 2010年12月31日 09:27 发表

明白,谢谢

回复评论
222.130.77.* 在 2011年1月24日 09:33 发表

看不懂

回复评论
71.145.154.* 在 2011年3月9日 23:26 发表

谢谢,这是我看到的解释t检验最清楚的文章了。 不知哪里有关于"多组间的比较"的好文章

回复评论
113.23.138.* 在 2011年4月10日 15:38 发表

much thx, cannot understand in english but in Mandarin is damn simple!

回复评论
118.186.130.* 在 2011年6月30日 20:03 发表

谢谢

回复评论
210.82.107.* 在 2011年7月19日 19:38 发表

以上说谢谢的都是天才啊!!!

回复评论
113.55.112.* 在 2011年9月10日 09:06 发表

t0.05 / 2.34 = 2.032中的2.34是什么啊?

回复评论
134.99.16.* 在 2011年11月26日 00:06 发表

和楼上有同样疑问 2.032是哪里来的?

回复评论
110.80.33.* 在 2011年11月26日 10:18 发表

134.99.16.* 在 2011年11月26日 00:06 发表

和楼上有同样疑问 2.032是哪里来的?

查询“t界值表”得来的~

回复评论
121.150.216.* 在 2011年12月13日 14:40 发表

xiexie

回复评论

发表评论请文明上网,理性发言并遵守有关规定。