T檢驗

出自 MBA智库百科(http://wiki.mbalib.com/)

T檢驗(T Test)

目錄

什麼是T檢驗

  T檢驗,亦稱student t檢驗(Student's t test),主要用於樣本含量較小(例如n<30),總體標準差σ未知的正態分佈資料。

  T檢驗是用於小樣本(樣本容量小於30)的兩個平均值差異程度的檢驗方法。它是用T分佈理論來推斷差異發生的概率,從而判定兩個平均數的差異是否顯著。

  T檢驗是戈斯特為了觀測釀酒質量而發明的。戈斯特在位於都柏林的健力士釀酒廠擔任統計學家。戈特特於1908年在Biometrika上公佈T檢驗,但因其老闆認為其為商業機密而被迫使用筆名(學生)。

  T檢驗的適用條件:正態分佈資料

單個樣本的t檢驗

  目的:比較樣本均數 所代表的未知總體均數μ和已知總體均數μ0

  計算公式:

  t統計量:t=\frac{|\overline{X}-\mu_0|}{S_{\overline{X}}}=\frac{\bar{X}-\mu_0}{s/\sqrt{n}}

  自由度:v=n - 1

  適用條件:

  (1) 已知一個總體均數;

  (2) 可得到一個樣本均數及該樣本標準誤;

  (3) 樣本來自正態或近似正態總體。

單個樣本的t檢驗實例分析[1]

  例1 難產兒出生體重 n=35,\bar{X}=3.42,  S=0.40,

  一般嬰兒出生體重μ0 = 3.30(大規模調查獲得),問相同否?

  解:1.建立假設、確定檢驗水準α

  H0:μ = μ0 (難產兒與一般嬰兒出生體重的總均數相等;H0無效假設,null hypothesis)

  H_1:\mu\ne\mu_0(難產兒與一般嬰兒出生體重的總均數不等;H1備擇假設,alternative hypothesis,)

  雙側檢驗,檢驗水準:α = 0.05

   2.計算檢驗統計量

  t=\frac{\bar{X}-\mu_0}{S/\sqrt{n}}=\frac{3.42-3.30}{0.40/\sqrt{35}}=1.77, v=n-1=35-1=34

  3.查相應界值表,確定P值,下結論

  查附表1: t0.05 / 2.34 = 2.032,t = 1.77,t < t0.05 / 2.34,P > 0.05,α = 0.05水準,不拒絕H0,兩者的差別無統計學意義,尚不能認為難產兒平均出生體重與一般嬰兒的出生體重不同

  

配對樣本t檢驗

  配對設計:將受試對象的某些重要特征按相近的原則配成對子,目的是消除混雜因素的影響,一對觀察對象之間除了處理因素/研究因素之外,其它因素基本齊同,每對中的兩個個體隨機給予兩種處理。

  • 兩種同質對象分別接受兩種不同的處理,如性別、年齡、體重、病情程度相同配成對。
  • 同一受試對象或同一樣本的兩個部分,分別接受兩種不同的處理
  • 自身對比。即同一受試對象處理前後的結果進行比較。

  目的:判斷不同的處理是否有差別

  計算公式及意義:

  t 統計量t=\frac{\bar{d}}{S_d/\sqrt{n}}

  自由度:v=對子數-1

  適用條件:配對資料

T檢驗的步驟[2]

  1、建立虛無假設H01 = μ2,即先假定兩個總體平均數之間沒有顯著差異;

  2、計算統計量t值,對於不同類型的問題選用不同的統計量計算方法;

  1)如果要評斷一個總體中的小樣本平均數與總體平均值之間的差異程度,其統計量t值的計算公式為:

  t=\frac{\bar{X}-\mu_0}{\sqrt{\frac{S}{n-1}}}

  2)如果要評斷兩組樣本平均數之間的差異程度,其統計量t值的計算公式為:

  t=\frac{\bar{X}_1-\bar{X}_2}{\sqrt{\frac{\sum x_1^2+\sum x_2^2}{n_1+n_2-2}\times\frac{n_1+n_2}{n_1\times n_2}}}

  3、根據自由度df=n-1,查t值表,找出規定的t理論值併進行比較。理論值差異的顯著水平為0.01級或0.05級。不同自由度的顯著水平理論值記為t(df)0.01和t(df)0.05

  4、比較計算得到的t值和理論t值,推斷發生的概率,依據下表給出的t值與差異顯著性關係表作出判斷。

T值與差異顯著性關係表
tP值差異顯著程度
t\ge t(df)0.01P\le 0.01差異非常顯著
t\ge t(df)0.05P\le 0.05差異顯著
t < t(df)0.05P > 0.05差異不顯著

  5、根據是以上分析,結合具體情況,作出結論。

T檢驗舉例說明

  例如,T檢驗可用於比較藥物治療組與安慰劑治療組病人的測量差別。理論上,即使樣本量很小時,也可以進行T檢驗。(如樣本量為10,一些學者聲稱甚至更小的樣本也行),只要每組中變數呈正態分佈,兩組方差不會明顯不同。如上所述,可以通過觀察數據的分佈或進行正態性檢驗估計數據的正態假設。方差齊性的假設可進行F檢驗,或進行更有效的Levene's檢驗。如果不滿足這些條件,只好使用非參數檢驗代替T檢驗進行兩組間均值的比較。

  T檢驗中的P值是接受兩均值存在差異這個假設可能犯錯的概率。在統計學上,當兩組觀察對象總體中的確不存在差別時,這個概率與我們拒絕了該假設有關。一些學者認為如果差異具有特定的方向性,我們只要考慮單側概率分佈,將所得到t-檢驗的P值分為兩半。另一些學者則認為無論何種情況下都要報告標準的雙側T檢驗概率。

  1、數據的排列

  為了進行獨立樣本T檢驗,需要一個自(分組)變數(如性別:男女)與一個因變數(如測量值)。根據自變數的特定值,比較各組中因變數的均值。用T檢驗比較下列男、女兒童身高的均值。

性別身高
對象1
對象2
對象3
對象4
對象5
男性
男性
男性
女性
女性
111
110
109
102
104
男性身高均數 = 110
女性身高均數 = 103

  2、T檢驗圖

  在T檢驗中用箱式圖可以直觀地看出均值與方差的比較,見下圖:

T检验

  這些圖示能夠很快地估計並且直觀地表現出分組變數與因變數關聯的強度。

  3、多組間的比較

  科研實踐中,經常需要進行兩組以上比較,或含有多個自變數並控制各個自變數單獨效應後的各組間的比較,(如性別、藥物類型與劑量),此時,需要用方差分析進行數據分析,方差分析被認為是T檢驗的推廣。在較為複雜的設計時,方差分析具有許多t-檢驗所不具備的優點。(進行多次的T檢驗進行比較設計中不同格子均值時)。

T檢驗註意事項

  • 要有嚴密的抽樣設計隨機、均衡、可比
  • 選用的檢驗方法必須符合其適用條件(註意:t檢驗的前提是資料服從正態分佈)
  • 單側檢驗和雙側檢驗

  單側檢驗的界值小於雙側檢驗的界值,因此更容易拒絕,犯第Ⅰ錯誤的可能性大。

  • 不能拒絕H0,有可能是樣本數量不夠拒絕H0 ,有可能犯第Ⅰ類錯誤
  • 正確理解P值與差別有無統計學意義

  P越小,不是說明實際差別越大,而是說越有理由拒絕H0 ,越有理由說明兩者有差異,差別有無統計學意義和有無專業上的實際意義並不完全相同

  • 結論具有一致性
  • 差異:提供的信息不同

  區間估計給出總體均值可能取值範圍,但不給出確切的概率值,假設檢驗可以給出H0成立與否的概率

參考文獻

  1. 宇傳華.醫療等本科班《醫學統計學》第三章 兩組資料均數的比較2 2010.12.1
  2. 李克東編著.第十三章 SPSS的應用 教育技術學主幹課程系列教材 教育技術學研究方法.北京師範大學出版社,2003年04月第1版.
本條目對我有幫助327
分享到:
  如果您認為本條目還有待完善,需要補充新內容或修改錯誤內容,請編輯條目

本条目由以下用户参与贡献

Zfj3000,001,苦行者,Angle Roh,Kane0135,Vulture,Zorji,Yixi,Dan,连晓雾.

評論(共57條)

提示:評論內容為網友針對條目"T檢驗"展開的討論,與本站觀點立場無關。
59.172.218.* 在 2008年5月17日 09:56 發表

看不懂,有好多字母代表了什麼東西都沒寫出來, 如X等某些詞。。。 這對外人來說都是不可理解的。

回複評論
219.131.18.* 在 2008年6月5日 15:53 發表

我越看越糊塗,一頭霧水

回複評論
134.76.63.* 在 2008年6月13日 19:38 發表

最好看看假設檢驗相關的材料,從幾種分佈到置信區間一路看過來,用不了幾天就可以明白了,東西不難。但是要會應用。

回複評論
125.90.58.* 在 2008年6月18日 13:04 發表

謝謝 o(∩_∩)o...

回複評論
121.8.43.* 在 2008年7月5日 15:36 發表

good~thx

回複評論
58.213.116.* 在 2008年7月9日 14:46 發表

很好 說的很詳細啊 謝謝

回複評論
211.31.87.* 在 2008年11月3日 08:29 發表

寫的很好,謝謝

回複評論
221.2.163.* 在 2008年11月3日 16:53 發表

Thank you.

回複評論
59.45.74.* 在 2008年11月16日 18:05 發表

very good

回複評論
128.240.229.* 在 2008年11月24日 06:11 發表

非常好~~

回複評論
220.192.227.* 在 2008年11月25日 08:07 發表

好!深入淺出,點到為止,好!

回複評論
68.31.46.* 在 2009年1月12日 06:50 發表

7年前學的統計,現在老婆讓我教她,只好上網惡補。文章總結得很好,尤其是還有例子,太感謝了!

回複評論
202.150.55.* 在 2009年1月29日 15:20 發表

看不懂,有好多字母代表了什麼東西都沒寫出來, 如X等某些詞。。。這對外人來說都是不可理解的。

回複評論
159.226.234.* 在 2009年2月16日 15:53 發表

很好。謝謝

回複評論
202.106.132.* 在 2009年6月23日 10:19 發表

沒看到T檢驗的舉例

回複評論
141.219.57.* 在 2009年11月20日 03:54 發表

very nice... it would be much better if you have a pair sample t-test.

回複評論
125.77.231.* 在 2009年12月15日 10:15 發表

terrific, thanks a lot.

回複評論
220.248.225.* 在 2009年12月22日 19:42 發表

謝了!!!

回複評論
116.16.61.* 在 2010年1月28日 00:18 發表

中文的看著暈....

回複評論
86.181.199.* 在 2010年3月21日 23:20 發表

感謝啊~

回複評論
113.251.160.* 在 2010年3月23日 14:33 發表

呵呵,不錯,通俗易懂~~

回複評論
124.90.203.* 在 2010年5月15日 15:10 發表

thank you

回複評論
122.96.83.* 在 2010年5月18日 21:41 發表

查附表1: t0.05 / 2.34 = 2.032,t = 1.77,t < t0.05 / 2.34, P > 0.05,按α=0.05水準,不拒絕H0,兩者的差別無統計學意義 LZ 的意思是不是 T0.05/2(34)=2.032!,下同

回複評論
61.154.122.* 在 2010年7月14日 15:54 發表

X—是平均數啊。。。這是基礎知識啊。。 樓上說字母是啥意思的。。。也太外行了吧。。。。

回複評論
117.27.27.* 在 2010年9月8日 15:19 發表

非常好!!

回複評論
183.14.47.* 在 2010年9月12日 00:41 發表

very good

回複評論
58.16.41.* 在 2010年9月19日 22:46 發表

解釋的挺好,十分感謝!

回複評論
64.238.165.* 在 2010年9月30日 22:10 發表

應該先去看ho h1假設 再看t test 不過這個寫的不錯 我通過例子看懂了

回複評論
221.226.44.* 在 2010年11月8日 18:43 發表

看不太懂

回複評論
114.255.218.* 在 2010年11月16日 20:58 發表

很詳細

回複評論
58.62.42.* 在 2010年11月21日 14:30 發表

只能說聲謝謝了! 比別的地方好多了,清楚得很!

回複評論
113.142.17.* 在 2010年12月1日 09:19 發表

第一個t的公式是不是有問題啊,錯把n寫為x了,好像…

回複評論
Yixi (討論 | 貢獻) 在 2010年12月1日 15:58 發表

113.142.17.* 在 2010年12月1日 09:19 發表

第一個t的公式是不是有問題啊,錯把n寫為x了,好像…

感謝您的指正,原文已修正,並增加了新的內容,謝謝您的參與。

回複評論
27.17.178.* 在 2010年12月22日 00:59 發表

不錯。

回複評論
218.26.243.* 在 2010年12月31日 09:27 發表

明白,謝謝

回複評論
222.130.77.* 在 2011年1月24日 09:33 發表

看不懂

回複評論
71.145.154.* 在 2011年3月9日 23:26 發表

謝謝,這是我看到的解釋t檢驗最清楚的文章了。 不知哪裡有關於"多組間的比較"的好文章

回複評論
113.23.138.* 在 2011年4月10日 15:38 發表

much thx, cannot understand in english but in Mandarin is damn simple!

回複評論
118.186.130.* 在 2011年6月30日 20:03 發表

謝謝

回複評論
210.82.107.* 在 2011年7月19日 19:38 發表

以上說謝謝的都是天才啊!!!

回複評論
113.55.112.* 在 2011年9月10日 09:06 發表

t0.05 / 2.34 = 2.032中的2.34是什麼啊?

回複評論
134.99.16.* 在 2011年11月26日 00:06 發表

和樓上有同樣疑問 2.032是哪裡來的?

回複評論
110.80.33.* 在 2011年11月26日 10:18 發表

134.99.16.* 在 2011年11月26日 00:06 發表

和樓上有同樣疑問 2.032是哪裡來的?

查詢“t界值表”得來的~

回複評論
121.150.216.* 在 2011年12月13日 14:40 發表

xiexie

回複評論
58.210.56.* 在 2012年2月15日 09:05 發表

你舉的嬰兒體重的例子算下來T<T(0.05),P>0.05,不拒絕H0,兩者的差別無統計學意義。既然差異概念不大,那最後一個結論我不知道是如何得來的,請教?

回複評論
123.13.214.* 在 2012年3月1日 19:02 發表

好,正好用到。希望繼續介紹多組檢驗。多謝!希望介紹用電子圖表如何運用-。

回複評論
119.146.220.* 在 2012年3月19日 22:59 發表

明白是明白了,可算還是不會算。痛苦啊!

回複評論
119.97.202.* 在 2012年5月12日 13:11 發表

S代表什麼

回複評論
183.4.219.* 在 2012年5月13日 20:03 發表

看了好多次了,終於明白一些了

回複評論
110.80.33.* 在 2012年5月15日 11:27 發表

119.97.202.* 在 2012年5月12日 13:11 發表

S代表什麼

標準差

回複評論
120.6.70.* 在 2012年7月1日 19:21 發表

一下是n,一下是n-1.都被弄糊塗了。能不能通過相關例題解釋下啊

回複評論
103.11.50.* 在 2013年8月23日 14:22 發表

根本看不懂 亂七八糟

回複評論
183.63.118.* 在 2013年11月26日 11:30 發表

公式是錯的...Σx1²+Σx2²那裡應該是樣本一的各數據與平均數一的差的平方的和...加上樣本二的各數據與平均數一的差的平方的和...你這錯誤的公式誤人子弟``

回複評論
连晓雾 (討論 | 貢獻) 在 2013年11月26日 13:49 發表

183.63.118.* 在 2013年11月26日 11:30 發表

公式是錯的...Σx1²+Σx2²那裡應該是樣本一的各數據與平均數一的差的平方的和...加上樣本二的各數據與平均數一的差的平方的和...你這錯誤的公式誤人子弟``

謝謝指正,內容已做更新~

MBA智庫百科是可以自由參與的百科,如有發現錯誤和不足,您也可以參與修改編輯,只要通過網頁右上角創建新帳號,創建用戶名後即可參與,期待您的加入!~

回複評論
109.31.168.* 在 2013年11月30日 01:43 發表

嬰兒那個圖片錯了,T 的自由度是34 不是2.34

回複評論
109.31.168.* 在 2013年11月30日 02:01 發表

113.23.138.* 在 2011年4月10日 15:38 發表

much thx, cannot understand in english but in Mandarin is damn simple!

  • many thx or thx so much
回複評論
77.80.29.* 在 2013年12月30日 22:03 發表

三克油

回複評論

發表評論請文明上網,理性發言並遵守有關規定。