零假設
出自 MBA智库百科(https://wiki.mbalib.com/)
零假設(null hypothesis)
目錄 |
零假設又稱原假設,是統計學術語,指進行統計檢驗時預先建立的假設。 零假設成立時,有關統計量應服從已知的某種概率分佈。當統計量的計算值落入否定域時,可知發生了小概率事件,應否定原假設。
在統計學中,零假設或虛無假設是做統計檢驗時的一類假設。零假設的內容一般是希望被證明為錯誤的假設或者是需要著重考慮的假設。比如說,在相關性檢驗中,一般會取“兩者之間無關聯”作為零假設,而在獨立性檢驗中,一般會取“兩者之間有關聯”作為零假設。與零假設相對的是備擇假設(對立假設),即希望證明是正確的另一種可能。從數學上來看,零假設和備擇假設的地位是相等的,但是在統計學的實際運用中,常常需要強調一類假設為應當或期望實現的假設。如果一個統計檢驗的結果拒絕零假設(結論不支持零假設),而實際上真實的情況屬於零假設,那麼稱這個檢驗犯了第一類錯誤。反之,如果檢驗結果支持零假設,而實際上真實的情況屬於備擇假設,那麼稱這個檢驗犯了第二類錯誤。通常的做法是,在保持第一類錯誤出現的機會在某個特定水平上的時候,儘量減少第二類錯誤出現的概率。
看到零假設的時候我們會自然地發問,這個“假設”太奇怪了,竟然叫零假設,難道還有什麼一假設和二假設嗎?換句話說,假設是可用數字來計量的嗎?對這個問題有一個好的理解的辦法可能需要提到相關係數,還有就是關於假設的一些簡單陳述。當我們想理解兩個事件是否相關的時候,我們用相關係數來測量它們之間的相關程度,它是介於-1到1的一個數值。當相關係數是零的時候,我們說這兩個事件沒有關係。假設就是我們對兩個事件之間關係的某種猜測。因此,如果們要研究兩個事件的關係時,零假設的意思就是說,兩件事情之間沒有關係。
當然,零假設仍然是一種假設,並不是對世界運動的客觀描述,至少在沒有證明它是正確的情形下這樣的表達是可靠的。零假設不過是我們研究兩個事物之間是否有關的時候我們能做出的最保守的假設。如果我們想知道溫室氣體排放的增加和全球變暖之間的關係,而在研究之前我們沒有做過任何的研究和調查,我們最保險的辦法就是認為這兩者之間沒有關係,這就是零假設。因為我們不知道它們之間是什麼樣的關係在研究之前,所以我們令可認為它們之間沒有關係。然後通過我們科學的調查研究,再排除那些偶然性的因素之後,我們得到的結論是溫室氣體排放使和全球變暖。
正如上面所提到的,零假設還要讓我們接受偶然性。許多事情的發生出於偶然,這是一個基本事實。由於偶然而導致兩個事情看起來有關係,或者說有關係,但實際上我們還是認為這兩者之間的關係仍然是不相關的,用零假設來描述它們的關係仍然是恰當的。偶然性是一個讓人著迷又易犯錯誤的領域,儘管它確實存在,但是在對它進行研究的人們仍然是我們人類中的強者。我們所要研究的是,在排除這些偶然性的因素之後得到的兩者之間的必然聯繫。只有這樣的結論才是可靠的,運用這樣的結論來改造世界才是安全的。
1.零假設一般是有意推翻的假設;
2.由於第一類錯誤的概率可以通過顯著性水平的選定加以控制,零假設一般是如果出現第一類錯誤後後果更為嚴重的情況的假設。
在假定零假設為真的前提下,確定樣本分佈形態和特征值(包括期望和方差)並選擇合適的統計量,然後,確定包括接受域,臨界值和拒絕域在內的決策標準;根據樣本數據計算出統計量並將其與決策標準比後得出結論。其間決策標準的邏輯意義在於,零假設為真時的樣本分佈中,抽樣數據落在拒絕域被設定為小概率事件,而小概率事件在一次試驗中幾乎是不可能發生的,一旦發生,可認定樣本數據落在拒絕域並非小概率事件,零假設為真的前提可以被推翻。
零假設的建立原則[1]
選用哪個命題做原假設,要視具體問題的目的和要求而定,它取決於犯兩類錯誤將會帶來的後果。一般的,按下麵幾個原則建立原假設:
1)往往把有把握的、不能輕易被否定的命題作為原假設H0,而把無把握的、不能輕易肯定的命題作為備擇假設。
如考慮新工藝是否能提高效益.只有真正能提高效益的新工藝才可能被採用.這是因為採用新工藝,必然要購進新設備、調整生產線、培訓人員等進行人力、物力、財力的投入.作為企業的主管部門,作出採用新工藝的決策應持慎重態度.若以U0代表採用新工藝前的平均效益,U代表採用新工藝下的平均效益,則原假設和備擇假設必須設為
H0:U≤U0; H1:U>U0.
這樣當在顯著性水平 α下,拒絕原假設H。時,才可認為新工藝確實提高效益.因為企業的主管部門心中有數,做錯這個結論的可能性大小隻有 α。
2)當我們的目的是希望取得對某一陳述強有力的支持時,把這一陳述的對立面作為原假設.仍用在1)中提到的例子,我們希望取得新工藝提高效益這一陳述的有力支持時,將其對立面“新工藝不能提高效益”作為原假設,即H0:U≤U0。
3.)儘量使後果嚴重的錯誤成為第一類錯誤.
例如,我們要檢驗某個求醫者是否患有某種疾病.如果原假設和備擇假設建立為
H0:患者患病; H1:患者不患病,
則犯第一類錯誤意味著是把患病當作不患病,後果是有可能導致此人死亡.
若將原假設和備擇假設建立為
H0:患者不患病; H1:患者患病,
則犯第一類錯誤意味著是把不患病當作患病,不僅給此人帶來精神上及身體上的痛苦,還會造成經濟上的浪費.雖然無論在哪種情形,有病當無病、無病當有病都有不良後果,但後果更嚴重的是將有病當無病.由於我們所做的檢驗控制的是犯第一類錯誤的概率,因此一般設H0:患者患病。
- ↑ 張玉環.淺談假設檢驗中原假設和備擇假設的建立(A).大學數學.2012,28(2):