卡方檢驗

出自 MBA智库百科(http://wiki.mbalib.com/)

卡方檢驗(Chi-square test/Chi-Square Goodness-of-Fit Test)

目錄

什麼是卡方檢驗

  卡方檢驗是一種用途很廣的計數資料的假設檢驗方法。它屬於非參數檢驗的範疇,主要是比較兩個及兩個以上樣本率( 構成比)以及兩個分類變數的關聯性分析。其根本思想就是在於比較理論頻數和實際頻數的吻合程度或擬合優度問題。

  它在分類資料統計推斷中的應用,包括:兩個率或兩個構成比比較的卡方檢驗;多個率或多個構成比比較的卡方檢驗以及分類資料的相關分析等。

卡方檢驗的基本原理[1]

卡方檢驗的基本思想

  卡方檢驗是以χ2分佈為基礎的一種常用假設檢驗方法,它的無效假設H0是:觀察頻數與期望頻數沒有差別。

  該檢驗的基本思想是:首先假設H0成立,基於此前提計算出χ2值,它表示觀察值與理論值之間的偏離程度。根據χ2分佈及自由度可以確定在H0假設成立的情況下獲得當前統計量及更極端情況的概率P。如果P值很小,說明觀察值與理論值偏離程度太大,應當拒絕無效假設,表示比較資料之間有顯著差異;否則就不能拒絕無效假設,尚不能認為樣本所代表的實際情況和理論假設有差別。

卡方值的計算與意義

  χ2值表示觀察值與理論值之問的偏離程度。計算這種偏離程度的基本思路如下。

  (1)設A代表某個類別的觀察頻數,E代表基於H0計算出的期望頻數,A與E之差稱為殘差。

  (2)顯然,殘差可以表示某一個類別觀察值和理論值的偏離程度,但如果將殘差簡單相加以表示各類別觀察頻數與期望頻數的差別,則有一定的不足之處。因為殘差有正有負,相加後會彼此抵消,總和仍然為0,為此可以將殘差平方後求和。

  (3)另一方面,殘差大小是一個相對的概念,相對於期望頻數為10時,期望頻數為20的殘差非常大,但相對於期望頻數為1 000時20的殘差就很小了。考慮到這一點,人們又將殘差平方除以期望頻數再求和,以估計觀察頻數與期望頻數的差別。

  進行上述操作之後,就得到了常用的χ2統計量,由於它最初是由英國統計學家Karl Pearson在1900年首次提出的,因此也稱之為Pearson χ2,其計算公式為
\chi^2=\sum \frac{(A-E)^2}{E}=\sum_{i=1}^k \frac{(A_i-E_i)^2}{E_i}=\sum_{i=1}^k \frac{(A_i-np_i)^2}{np_i}  (i=1,2,3,…,k)

  其中,Ai為i水平的觀察頻數,Ei為i水平的期望頻數,n為總頻數,pi為i水平的期望頻率。i水平的期望頻數Ti等於總頻數n×i水平的期望概率pi,k為單元格數。當n比較大時,χ2統計量近似服從k-1(計算Ei時用到的參數個數)個自由度的卡方分佈

  作為學術界的領袖,Pearson先生當初發表在《哲學雜誌》上的χ2論文題目為:On the criterion that a given system of deviations from the probable in the case of a correlated system of variables is such that it can be reasonably supposed to have arisen from random sampling.

  由卡方的計算公式可知,當觀察頻數與期望頻數完全一致時,χ2值為0;觀察頻數與期望頻數越接近,兩者之間的差異越小,χ2值越小;反之,觀察頻數與期望頻數差別越大,兩者之間的差異越大,χ2值越大。換言之,大的χ2值表明觀察頻數遠離期望頻數,即表明遠離假設。小的χ2值表明觀察頻數接近期望頻數,接近假設。因此,χ2是觀察頻數與期望頻數之間距離的一種度量指標,也是假設成立與否的度量指標。如果χ2值“小”,研究者就傾向於不拒絕H0;如果χ2值大,就傾向於拒絕H0。至於χ2在每個具體研究中究竟要大到什麼程度才能拒絕H0,則要藉助於卡方分佈求出所對應的P值來確定。

卡方檢驗的樣本量要求

  卡方分佈本身是連續型分佈,但是在分類資料的統計分析中,顯然頻數只能以整數形式出現,因此計算出的統計量是非連續的。只有當樣本量比較充足時,才可以忽略兩者問的差異,否則將可能導致較大的偏差具體而言,一般認為對於卡方檢驗中的每一個單元格,要求其最小期望頻數均大於1,且至少有4/5的單元格期望頻數大於5,此時使用卡方分佈計算出的概率值才是準確的。如果數據不符合要求,可以採用確切概率法進行概率的計算。

卡方檢驗的類型[2]

  1、四格表資料的卡方檢驗

  四格表資料的卡方檢驗用於進行兩個率或兩個構成比的比較。

  1)專用公式:

  若四格表資料四個格子的頻數分別為a,b,c,d,則四格表資料卡方檢驗的卡方值=(ad-bc)2 \times n/(a+b)(c+d)(a+c)(b+d),自由度v=(行數-1)(列數-1)

  2)應用條件:

  要求樣本含量應大於40且每個格子中的理論頻數不應小於5。當樣本含量大於40但理論頻數有小於5的情況時卡方值需要校正,當樣本含量小於40時只能用確切概率法計算概率。

  2、行×列表資料的卡方檢驗

  行×列表資料的卡方檢驗用於多個率或多個構成比的比較。

  1)專用公式:

  r行c列表資料卡方檢驗的卡方值=n[(A_{11}/n_1n_1+A_{12}/n_1n_2+\cdots+A_{rc}/n_rn_c)-1]

  2)應用條件:

  要求每個格子中的理論頻數T均大於5或1<T<5的格子數不超過總格子數的1/5。當有T<1或1<T<5的格子較多時,可採用並行併列、刪行刪列、增大樣本含量的辦法使其符合行×列表資料卡方檢驗的應用條件。而多個率的兩兩比較可採用行×列表分割的辦法。

  3、列聯表資料的卡方檢驗

  同一組對象,觀察每一個個體對兩種分類方法的表現,結果構成雙向交叉排列的統計表就是列聯表。

  1)R×C 列聯表的卡方檢驗:

  R×C 列聯表的卡方檢驗用於R×C列聯表的相關分析,卡方值的計算和檢驗過程與行×列表資料的卡方檢驗相同。

  2)2×2列聯表的卡方檢驗:

  2×2列聯表的卡方檢驗又稱配對記數資料或配對四格表資料的卡方檢驗,根據卡方值計算公式的不同,可以達到不同的目的。當用一般四格表的卡方檢驗計算時,卡方值=(ad-bc)2n/(a+b)(c+d)(a+c)(b+d),此時用於進行配對四格表的相關分析,如考察兩種檢驗方法的結果有無關係;當卡方值=( | bc | − 1)2/(b+c)時,此時卡方檢驗用來進行四格表的差異檢驗,如考察兩種檢驗方法的檢出率有無差別。

  列聯表卡方檢驗應用中的註意事項同R×C表的卡方檢驗相同。

卡方檢驗的用途[1]

  卡方檢驗最常見的用途就是考察某無序分類變數各水平在兩組或多組間的分佈是否一致實際上,除了這個用途之外.膏方檢驗還有更廣泛的應用。具體而言,其用途主要包括以下幾個方面:

  (1)檢驗某個連續變數的分佈是否與某種理論分佈相一致。如是否符合正態分佈、是否服從均勻分佈、是否服從Poisson分佈等。

  (2)檢驗某個分類變數各類的出現概率是否等於指定概率。如在36選7的彩票抽獎中,每個數字出現的概率是否各為1/36;擲硬幣時,正反兩面出現的概率是否均為0.5。

  (3)檢驗某兩個分類變數是否相互獨立。如吸煙(二分類變數:是、否)是否與呼吸道疾病(二分類變數:是、否)有關;產品原料種類(多分類變數)是否與產品合格(二分類變數)有關。

  (4)檢驗控制某種或某幾種分類因素的作用以後,另兩個分類變數是否相互獨立。如在上例中,控制性別、年齡因素影響以後,吸煙是否和呼吸道疾病有關;控制產品加工工藝的影響後,產品原料類別是否與產品合格有關。

  (5)檢驗某兩種方法的結果是否一致。如採用兩種診斷方法對同一批人進行診斷,其診斷結果是否一致;採用兩種方法對客戶進行價值類別預測,預測結果是否一致。

卡方檢驗的應用條件[3]

  適用於四格表應用條件:

  1)隨機樣本數據。兩個獨立樣本比較可以分以下3種情況:

  (1)所有的理論數T≥5並且總樣本量n≥40,用Pearson卡方進行檢驗。

  (2)如果理論數T<5但T≥1,並且1≥40,用連續性校正的卡方進行檢驗。

  (3)如果有理論數T<1或n<40,則用Fisher’s檢驗。

  2)卡方檢驗的理論頻數不能太小。

  R×C表卡方檢驗應用條件:

  (1)R×C表中理論數小於5的格子不能超過1/5;

  (2)不能有小於1的理論數。如果實驗中有不符合R×C表的卡方檢驗,可以通過增加樣本數、列合併來實現。

卡方檢驗應用實例[4]

  1.應用實例——適合度檢驗

  實際執行多項式試驗而得到的觀察次數,與虛無假設的期望次數相比較,稱為卡方適度檢驗,即在於檢驗二者接近的程度,利用樣本數據以檢驗總體分佈是否為某一特定分佈的統計方法。這裡以擲骰子為例介紹適度檢驗的方法。

  【例1】

  (1)假設擲一骰子120次,各點數共出現次數為a,b為各點數出現的期望值120×1/6=20,建立工作表文件,如圖1所示。

  (2)設置零假設H0:觀察分佈等於期望分佈。

  (3)計算卡方檢驗統計量,如圖2所示。

  D2=(B2-C2)^2/C2

  D8=SUM(D2:D7)

Image:适合度检验.jpg

  (4)確定自由度,(6-1)×(2-1)=5;選擇顯著水平α=0.05。

  (5)利用Excel提供的CHIINV函數求臨界值,在D9單元格中鍵入“=CHIINV(0.05,5)”按回車鍵,得臨界值11.07。

  (6)比較臨界值和統計量,11.07>2.3,即臨界值大於統計量,故差異不顯著,接受H0

  2.應用實例2——獨立性檢驗

  卡方獨立性檢驗是用來檢驗兩個屬性間是否獨立。一個變數作為行,另一個變數作為列。下麵一例便是介紹卡方獨立性檢驗的方法。

  【例2】某機構欲瞭解現在性別與收入是否有關,他們隨機抽樣500人,詢問對此的看法,結果分為“有關、無關、不好說,,三種答案,圖3中縣調查得到的數據。 Image:图3 调查数据表.jpg

  下麵是利用Excel解決此問題的步驟。

  (1)零假設H0:性別與收入無關。

  (2)確定自由度為(3-1)×(2-1)=2,選擇顯著水平α=0.05。

  (3)求解男女對收入與性別相關不同看法的期望次數,這裡採用所在行列的合計值的乘機除以總計值來計算每一個期望值,如圖4所示,在單元格B9中鍵入“=B5*E3/E5”,同理(第一個等於號理解為在單元格中鍵入):

  • B10=“=B5*E4/E5”,
  • C9=“=C5*E3/E5”,
  • C10=“=C5*E4/E5”,
  • D9=“=D5*E3/E5”,
  • D10=“=D5*E4/E5”。

  (4)利用卡方統計量計算公式計算統計量,在單元格B15中鍵入“=(B3-B9)^2/B9”,其餘單元格依次類推,結果如圖5所示。 Image:独立性检验.jpg

  \Chi^2=\sum \frac{(f_0 - f_e)^2}{f_e}=21.4675

  (5)利用Excel提供的CHIINV函數計算顯著水平為0.05,自由度為2卡方分佈的臨界值,在Excel單元格中鍵入“=CHIINV(0.05,2)”按回車鍵,得臨界值為5.9915。

  (6)比較統計量度和臨界值,統計量21.4675大於臨界值5.9915,故拒絕零假設。

  3.應用實例3——統一性檢驗

  檢驗兩個或兩個以上總體的某一特性分佈,也就是各“類別”的比例是否統一或相近,一般稱為卡方統一性檢驗或者卡方同質性檢驗。下麵一例便是利用卡方統一性檢驗的例子。

  【倒3】某咨詢公司想瞭解南京和北京的市民對最低生活保障的滿意程度是否相同。他們從南京抽出600居民,北京抽取600居民,每個居民對滿意程度(非常滿意、滿意、不滿意、非常不滿意)任選一種,且只能選一種。將統計結果鍵入Excel工作表中,如圖6所示。 Image:图6 抽查统计结果.jpg

  下麵是利用Excel解決此問題的步驟。

  (1)零假設H0:南京和北京居民對最低生活保障滿意程度的比例相同。

  (2)確定自由度為(4-1)×(2-1)=3,選擇顯著水平α=0.05。

  (3)求解卡方檢驗的l臨界值,在Excel單元格中鍵入“=CHIINV(0.05,3)”,按回車鍵得臨界值為7.81。

  (4)計算北京和南京不同滿意程度的期望值,在單元格B11和C11中分別鍵入“=$B$7*D3/$D$7”和“=$C$7*D3/$D$7”,選中B11:C11,按住C11右下角填充控制點,填充至C14。

  (5)計算卡方統計量,在單元格B19中鍵入“=(B3-B11)^2/B11”,其餘單元格依次類推,結果如圖7所示。 Image:图7 期望值和统计量计算.jpg

  \Chi^2=\sum \frac{(f_0 - f_e)^2}{f_e} = 1.3875

  (6)比較統計量和臨界值,統計量1.3875小於臨界值7.81,故接受零假設。

參考文獻

  1. 1.0 1.1 張文彤,鄺春偉編著.第16章 無序分類變數的統計推斷——卡方檢驗 SPSS統計分析基礎教程 第2版.高等教育出版社,2011.11.
  2. 劉鐵民主編.第十章 安全生產統計分析 安全生產管理知識 2006版.中國大百科全書出版社,2006年05月第1版.
  3. 卡方檢驗的應用條件[J].中國醫葯科學,2013,(第2期).
  4. 孫志剛,楊聰.第八章 假設檢驗 Excel在經濟與數理統計中的應用.中國電力出版社,2004年01月第1版.
本條目對我有幫助151
分享到:
  如果您認為本條目還有待完善,需要補充新內容或修改錯誤內容,請編輯條目

評論(共19條)

提示:評論內容為網友針對條目"卡方檢驗"展開的討論,與本站觀點立場無關。
202.114.136.* 在 2008年8月28日 21:02 發表

很好,謝謝。但請問一下,什麼是pearson chi-squsre

回複評論
Hnoju (討論 | 貢獻) 在 2008年8月29日 13:48 發表

202.114.136.* 在 2008年8月28日 21:02 發表

很好,謝謝。但請問一下,什麼是pearson chi-squsre

您指的pearson chi-squsre,不知是否為Pearson Chi-Square,二者有一單詞不一樣,Pearson Chi-Square(皮爾森卡方檢驗)即常用的卡方檢驗

回複評論
211.100.210.* 在 2009年1月13日 14:20 發表

謝謝

回複評論
118.250.2.* 在 2009年10月21日 23:05 發表

請問 卡方檢驗用於2行c列表的計算時 若不用其專用公式計算卡方值 ,想用理論頻數計算時 怎麼算

回複評論
58.254.92.* 在 2010年6月2日 13:17 發表

那個四格表不知怎麼看的

回複評論
117.27.27.* 在 2010年9月8日 15:21 發表

謝謝

回複評論
116.253.106.* 在 2010年11月7日 23:57 發表

四個表這樣看不出來,要經過計算差值、平方值等最後計算卡方值得出結果!

回複評論
114.83.229.* 在 2011年6月25日 14:43 發表

孤烽到似家將熱熱健康了gre

回複評論
114.83.229.* 在 2011年6月25日 14:45 發表

表1:暗示療法對癌痛患者止痛劑效果 組別 有效 顯效 合計 顯效率(%) 實驗組 5 39 44 88.64 對照組 13 32 45 71.11 合計 18 71 89 79.78 請幫我計算卡方值,P值有沒有意義.謝謝

回複評論
114.83.229.* 在 2011年6月25日 14:47 發表

組別 有效 顯效 合計 顯效率(%) 實驗組 5 39 44 88.64 對照組 13 32 45 71.11 合計 18 71 89 79.78 請幫我計算卡方值,P只是否有意義。萬分感謝

回複評論
61.178.18.* 在 2011年10月19日 20:41 發表

謝謝,想問一下,用excel可以卡方檢驗麽?

回複評論
Dan (討論 | 貢獻) 在 2011年10月20日 12:16 發表

61.178.18.* 在 2011年10月19日 20:41 發表

謝謝,想問一下,用excel可以卡方檢驗麽?

添加了excel的應用實例,希望對你有幫助~

回複評論
220.248.45.* 在 2012年3月5日 14:10 發表

114.83.229.* 在 2011年6月25日 14:47 發表

組別 有效 顯效 合計 顯效率(%) 實驗組 5 39 44 88.64 對照組 13 32 45 71.11 合計 18 71 89 79.78 請幫我計算卡方值,P只是否有意義。萬分感謝

Chi-Square Value: 4.235, Critical Value: 3.841, Accept Ha, There is significant difference between Tested and Control Group. It shows that your treatment is valid.

回複評論
123.182.67.* 在 2012年5月13日 16:29 發表

非常好,看起來簡單易懂!謝謝!

回複評論
119.98.146.* 在 2012年5月29日 11:45 發表

第二個例子漏洞百出

回複評論
泡芙小姐 (討論 | 貢獻) 在 2012年5月30日 10:02 發表

119.98.146.* 在 2012年5月29日 11:45 發表

第二個例子漏洞百出

已核對參考文獻併進行了修改,希望對您有幫助!

  MBA智庫百科是可以自由參與的百科,如有發現錯誤和不足,您也可以參與修改編輯,只要通過網頁右上的創建新帳號,創建用戶名後即可參與,期待您的加入!~

回複評論
58.246.161.* 在 2012年12月26日 14:29 發表

恩,很好,但是看不懂。

回複評論
180.160.6.* 在 2013年7月21日 20:55 發表

58.246.161.* 在 2012年12月26日 14:29 發表

恩,很好,但是看不懂。

確實看不懂哇,怎麼辦?還是不知道卡方檢驗是幹嘛的,什麼時候用,怎麼看!

回複評論
218.4.189.* 在 2014年5月20日 21:00 發表

分類變數的關聯繫檢驗。不過卡方檢驗只能說明統計學上有意義,並且變數略大,還要結合列聯繫數吧應該是,來對此,sig值一般要小於0.05,才能拒絕原假設。

回複評論

發表評論請文明上網,理性發言並遵守有關規定。