威廉·戈塞
出自 MBA智库百科(https://wiki.mbalib.com/)
威廉·戈塞(William Sealy Gosset,1876.6.13-1937.10.16):小樣本理論研究的先驅。威廉·希利·戈塞是一位化學家、數學家與統計學家,以筆名“Student”著名。
戈塞(William Sealey Gosset)出生於英國肯特郡坎特伯雷市,求學於曼徹斯特學院和牛津大學,主要學習化學和數學。1899年,戈塞進入都柏林的A.吉尼斯父子釀酒廠,在那裡可得到一大堆有關釀造方法、原料(大麥等)特性和成品質量之間的關係的統計數據。提高大麥質量的重要性最終促使他研究農田試驗計劃,並於1904年寫成第一篇報告《誤差法則應用》。
戈塞是英國現代統計方法發展的先驅,由他導出的統計學T檢驗廣泛運用於小樣本平均數之間的差別測試。他曾在倫敦大學K.皮爾遜生物統計學驗室從事研究(1906-1907),對統計理論的最顯著貢獻是《平均數的機誤》(1908)。這篇論文闡明,如果是小樣本,那麼平均數比例對其標準誤差的分佈不遵循正態曲線。由於吉尼斯釀酒廠的規定禁止戈塞發表關於釀酒過程變化性的研究成果,因此戈塞不得不於1908年以“學生”的筆名發表他的論文,導致該統計被稱為“學生”的筆名發表他的論文,導致該統計被稱為“學生的T檢驗”。1907-1937年間,戈塞發表了22篇統計學論文,這些論文於1942年以《“學生”論文集》為書名重新發行。
戈塞是英國現代統計方法發展的先驅,由他導出的統計學T檢驗廣泛運用於小樣本平均數之間的差別測試。他曾在倫敦大學K.皮爾遜生物統計學驗室從事研究(1906-1907),對統計理論的最顯著貢獻是《平均數的機誤》(1908)。這篇論文闡明,如果是小樣本,那麼平均數比例對其標準誤差的分佈不遵循正態曲線。由於吉尼斯釀酒廠的規定禁止戈塞發表關於釀酒過程變化性的研究成果,因此戈塞不得不於1908年,Gosset首次以“學生” (Student)為筆名,在《生物計量學》雜誌上發表了“平均數的概率誤差”。Gosset在文章中使用Z統計量來檢驗常態分配母群的平均數。由於這篇文章提供了“學生t檢驗”的基礎,為此,許多統計學家把1908年看作是統計推斷理論發展史上的里程碑。後來,哥塞特又連續發表了“相關係數的概率誤差” (1909)、“非隨機抽樣的樣本平均數分佈”(1909)、“從無限總體隨機抽樣平均數的概率估算表”(1917),等等。他在這些論文中,第一,比較了平均誤差與標準誤差的兩種計算方法;第二,研究了泊松分佈應用中的樣本誤差問題;第三,建立了相關係數的抽樣分佈;第四,導入了“學生”分佈,即t分佈。這些論文的完成,為“小樣本理論”奠定了基礎;同時,也為以後的樣本資料的統計分析與解釋開創了一條嶄新的路子。由於哥塞特開創的理論使統計學開始由大樣本向小樣本、由描述向推斷發展,因此,有人把哥塞特推崇為推斷統計學的先驅者。
William Sealey Grosset在20世紀前三十餘年是統計界的活躍人物,他的成就不限於《均》文,同年他發表了在總體相關係數為0時,二元正態樣本相關係數的精確分佈,這是關於正態樣本相關係數的第1個小樣本結。
他對回歸和試驗設計方面也有相當的研究,在與費歇爾的通信中時常討論到這些問題。費歇爾很尊重他的意見,常把自己工作的抽印本送給William Sealey Grosset請他指教,在當時,能受到費歇爾如此看待的學者為數不多。
William Sealey Grosset的一些思想,對他日後與奈曼合作建立其假設檢驗理論有著啟發性的影響,他說(引自《耐曼:現代統計學家》):“我認為現在統計學界中有非常多的成就都應歸功於William Sealey Grosset……。”
戈塞是小樣本統計理論的開創者,戈塞在釀酒公司工作中發現,供釀酒的每批麥子質量相差很大,而同一批麥子中能抽樣供試驗的麥子又很少,每批樣本在不同的溫度下做實驗,其結果相差很大,這樣一來,實際上取得的麥子樣本,不可能是大樣本,只能是小樣本。可是,從小樣本來分析數據是否可靠?誤差有多大?小樣本理論就在這樣的背景下應運而生。1905年,戈塞利用酒廠里大量的小樣本數據寫了第一篇論文《誤差法則在釀酒過程中的應用》,在此基礎上,1907年戈塞決心把小樣本和大樣本之間的差別搞清楚。為此,他試圖把一個總體中的所有小樣本的平均數的分佈刻畫出來,做法是,在一個大容器里放了一批紙牌,把它們弄亂,隨機地抽若幹張,對這一樣本做實驗記錄觀察值,然後再把紙牌弄亂,抽出幾張,對相應的樣本再做實驗觀察,記錄觀察值,大量地記錄這種隨機抽樣的小樣本觀察值,就可藉以獲得小樣本觀察值的分佈函數,若觀察值是平均數,戈塞把它叫做t分佈函數。1908年,戈塞以“學生(Student)”為筆名在《生物計量學》雜誌發表了論文《平均數的規律誤差》。這篇論文開創了小樣本統計理論的先河,為研究樣本分佈理論奠定了重要基礎,被統計學家譽為統計推斷理論發展史上的里程碑。戈塞這項成果,不僅不再依靠近似計算,而且能用所謂小樣本來進行推斷,並且還成為使統計學的對象由集團現象轉變為隨機現象的轉機,換句話說,總體應理解為含有未知參數的概率分佈(總體分佈)所定義的概率空間;要根據樣本來推斷總體,還必須強調樣本要從總體中隨機地抽取,也就說,一定要是隨機樣本。但是,應該指出:戈塞推導t分佈的方法是極不完整的,後來費希爾利用n維幾何方法給出了完整的證明。戈塞在其論著中,引入了均值、方差、方差分析、樣本等概率、統計的一些基本概念和術語。1907-1937年間,戈塞發表了22篇統計學論文,這些論文於 1942年以《“學生”論文集》為書名重新發行。