檢驗效能

用手机看条目

出自 MBA智库百科(https://wiki.mbalib.com/)

檢驗效能(power of test)

什麼是檢驗效能^[1]

　　檢驗效能或把握度，是指兩總體確有差別，按α水準能發現它們有差別的能力。用1-β表示其概率大小。

檢驗效能的估計^[1]

　　檢驗效能只取單側，一般認為檢驗效能至少取0．80。β表示第二類錯誤的概率，其大小很難確切估計。一般藉助於求 $u β$ ，再查u值表估計β，然後求1-β。

　　假設檢驗結果出現P>α時，則不拒絕檢驗假設 $H 0$ ，稱差別無統計學意義，臨床常叫“陰性”結果。但“陰性”結果有兩種可能：①β較小，即1-β較大，或當樣本含量n>400時，就認為被比較的指標間很可能無差別。②β較大，即1-β較小，如小於0．80(也有學者認為小於0．70)，且n<400時，便認為所比較的指標間很可能差異有統計學意義，由於樣本含量不足未能發現，是“假陰性”結果。因此在估算樣本含量時，要考慮檢驗效能。部分計算 $u β$ 的公式是由樣本含量估算式、通過恆等變換導出，故統計符號與意義均相同。

　　常用計算 $u β$ 的公式如下。

　　1．兩樣本均數比較 $u_\beta=\frac{\sqrt{n}|X_e-X_c|}{\sigma \sqrt{(1+1/k)}}-u_\alpha$ 　　(1) 　　2．兩樣本率比較 $u_\beta=\frac{\sqrt{n}|p_e-p_c|}{\sqrt{(1+1/k)p(1-p)}}-u_\alpha$ 　　(2)

　　3．病例對照研究

　　非配對 $u_\beta=\frac{\sqrt{n(p_1-p_0)^2}-u_\alpha \sqrt{2pq}}{\sqrt{p_1q_1+p_0q_0)}}$ 　　(3) 　　1：1配對 $u_\beta=\frac{\sqrt{n(p-1/2)^2}-u_\alpha /2}{\sqrt{p(1-p)}}$ 　　(4) 　　1：C配對 $u_\beta=\frac{[n(p_1-p_0)^2]-u_\alpha[(1+1/c)pq]^{1/2}}{[p_0q_0+p_1q_1/c]^{1/2}}$ 　　(5)

　　例1　　某醫師研究藥物對宮縮及外陰創傷的鎮痛效果，若新藥組觀察40例、鎮痛率 75％，舊藥組觀察60例、鎮痛率55％，當單側 $U 0.05 = 1.6449$ ，問該試驗檢驗效能如何?

　　本例試驗組有效率

p e = 0.75

、樣本含量

n e = 40

；對照組有效率

p c = 0.55

、樣本含量

n c = 60

，平均有效率P=(40×0．75+60×0．55)／(40+60)=0．63；k=60／40=1．5，又試驗組n=40、對照組kn=60，已知

U 0.05 = 1.6449

，代入式(2)，得： $u_\beta=\frac{\sqrt{n}|p_e-p_c|}{\sqrt{(1+1/k)p(1-p)}}-u_\alpha$ 　　(2) $=\frac{\sqrt{40}|0.75-0.55|}{\sqrt{(1+1/1.5)\times 0.63\times (1-0.63)}}-1.6449$

= 2.0294 - 1.6449 = 0.3845

　　以 $u β = 0.3845$ 查u值表，得0．40>β>0．30，即0．60<1-β<0．70。故該試驗檢驗效能為0．60～0．70，可認為該試驗檢驗效能小，與樣本含量不足有關。

[編輯]

檢驗效能的決定因素^[2]

　　檢驗效能的大小主要與以下四個因素有關。

　　(1)總體差別的大小：正確選擇被試因素及其水平，這是實驗成敗的首要環節。被試因素的有效性越強， $H 0$ 與 $H 1$ 涉及的不同總體均數之間的差距越大，兩者在分佈上的重疊面積就越小。由於β較小，1-β就必然較大。

　　(2)檢驗水準(α)的大小：通常 $H 0$ 與 $H 1$ 兩個總體存在一定的重疊面積，界值移動必然引起α與β同時改變。由於α與β存在反變關係，故通過增大口值可提高檢驗效能1-β。然而假設檢驗的目的大多是希望提示被試因素有效性高，應當要求d值越小越好；若將α值過分增大，顯然是不恰當的。相反，如將α過分縮小，勢必引起β增大，檢驗效能降低。因此，在實驗設計時，必須合理地兼顧α與β。在通常情況下，實驗設計時α取0．05，β取0．10或0．05。

　　(3)標準差的大小：由於α與β呈反比，兩全其美的方法就是使兩個相互比較的總體分佈都很集中，重疊面積縮小，這樣就可收到α與β均減小的效果。在兩個總體均數與樣本含量固定的條件下，各總體分佈的面積不變，但其擴布範圍與標準差成正比。因此，儘量減小個體差異，嚴格控制實驗條件，認真遵守操作規程，努力使標準差減小到合理水平，這是提高檢驗效能的重要途徑之一。

　　(4)樣本含量的多少：在兩總體均數與標準差固定的條件下，儘管總體分佈的擴布範圍不變，但隨著樣本含量(n)增大，標準誤縮小，總體分佈趨向集中，α與β都減小，因而檢驗效能增加。所以，對於提高檢驗效能而言，增大樣本含量，這也是一種兩全其美的辦法。在理論上，任何真實存在的差異不論大小與有無實際意義，只要有足夠大的咒，通過假設檢驗都可以檢出具有統計意義。然而在科研中必須首先考慮差異程度的實際意義，不能盲目地擴大樣本含量。同時也應看到：樣本含量由n增大至m倍(即m×n)，標準誤僅縮小至 $\sqrt{m\times n}$ 倍。例如，樣本含量由n增至9n，標準誤 $s_{\bar{x}}$ 僅減至原來的1／3。因此，通過增大n來提高檢驗效能，其代價是相當高的，在數量上必須適可而止。

[編輯]

檢驗效能的意義^[3]

　　檢驗效能，又稱假設檢驗的功效(power of a test)，用1-β表示，其意義是，當所研究的總體與 $H 0$ 確有差別時，按照檢驗水準α能夠發現它(拒絕 $H 0$ )的概率。若1-β=0.90，則意味著當 $H 0$ 不成立時，理論上在100次抽樣實驗中，在α檢驗水準上平均有90次能拒絕 $H 0$ 。檢驗效能可用小數(或百分數)表示，一般取0．99、0．95、0．90、0．80、0．50。研究中要求的檢驗效能越高，所需的樣本含量也越大。樣本含量、客觀事物差異的大小、個體間變異的大小和α值都是影響檢驗功效的要素。當樣本含量固定時，α與β呈反向變化的關係，即α增大，β減小，反之亦然；若欲同時減小α與β，則只有增加樣本含量。因此，若要增大檢驗效能(增大1-β，減小β)，一是增大α，二是增大樣本含量。

　　檢驗效能雖然不是設計時需要解決的，但在查閱文獻和借鑒前人經驗時應當認真考慮。當假設檢驗根據P>0．05做出無統計學意義的結論時，研究者則面臨著犯Ⅱ型錯誤的可能性，應當考慮是否總體間的差異確實存在，但由於檢驗效能不足而未能把該差異反映出來。

[編輯]

參考文獻

↑ ^1.0 ^1.1 王家良主編.臨床流行病學臨床科研設計、測量與評價.上海科學技術出版社,2009.12.
↑ 賀石林,李元建主編.醫學科研方法學.人民軍醫出版社,2003.10.
↑ 丁元林,高歌主編.衛生統計學.科學出版社,2008.07.

取自"https://wiki.mbalib.com/zh-tw/%E6%A3%80%E9%AA%8C%E6%95%88%E8%83%BD"

打开MBA智库App, 阅读完整内容打开App

如果您認為本條目還有待完善，需要補充新內容或修改錯誤內容，請編輯條目或投訴舉報。

本条目由以下用户参与贡献

李漠,连晓雾,y桑,otf125.

頁面分類: 統計術語

評論(共3條)

提示:評論內容為網友針對條目"檢驗效能"展開的討論，與本站觀點立場無關。

111.1.120.* 在 2017年7月31日 21:30 發表

第一行的概念錯了是按啊發發現其差異的能力不是。貝塔

回複評論

192.168.1.* 在 2018年10月15日 13:41 發表

概念錯誤，應該是按α水準。

回複評論

otf125 (討論 | 貢獻) 在 2018年10月16日 10:05 發表

192.168.1.* 在 2018年10月15日 13:41 發表

概念錯誤，應該是按α水準。

我把它改正過來了，其實你點編輯就能自己改啦。

回複評論

發表評論請文明上網，理性發言並遵守有關規定。

查看

工具▼

檢驗效能

出自 MBA智库百科(https://wiki.mbalib.com/)

目錄

什麼是檢驗效能^[1]

檢驗效能的估計^[1]

檢驗效能的決定因素^[2]

檢驗效能的意義^[3]

參考文獻

温馨提示

本条目相关课程

本条目由以下用户参与贡献

評論(共3條)

導航

意见反馈

查看

工具▼

檢驗效能

出自 MBA智库百科(https://wiki.mbalib.com/)

目錄

什麼是檢驗效能[1]

檢驗效能的估計[1]

檢驗效能的決定因素[2]

檢驗效能的意義[3]

參考文獻

温馨提示

本條目相關文檔

本条目相关课程

本条目由以下用户参与贡献

評論(共3條)

導航

意见反馈

什麼是檢驗效能^[1]

檢驗效能的估計^[1]

檢驗效能的決定因素^[2]

檢驗效能的意義^[3]