數理統計學
出自 MBA智库百科(https://wiki.mbalib.com/)
數理統計學(Mathematical Statistics)
目錄 |
數理統計學是統計學的數學基礎,從數學的角度去研究統計學,為各種應用統計學提供理論支持。它研究怎樣有效地收集、整理和分析帶有隨機性的數據,以對所考察的問題作出推斷或預測,直至為採取一定的決策和行動提供依據和建議的數學分支。
數理統計學是伴隨著概率論的發展而發展起來的。19世紀中葉以前已出現了若幹重要的工作,如C.F.高斯和A.M.勒讓德關於觀測數據誤差分析和最小二乘法的研究。到19世紀末期,經過包括K.皮爾森在內的一些學者的努力,這門學科已開始形成。但數理統計學發展成一門成熟的學科,則是20世紀上半葉的事,它在很大程度上要歸功於K.皮爾森、R.A.費希爾等學者的工作。特別是費希爾的貢獻,對這門學科的建立起了決定性的作用。1946年H.克拉默發表的《統計學數學方法》是第一部嚴謹且比較系統的數理統計著作,可以把它作為數理統計學進入成熟階段的標誌。
數理統計學的發展大致可分3個時期。
第一時期:20 世紀以前。這個時期又可分成兩段,大致上可以把高斯和勒讓德關於最小二乘法用於觀測數據的誤差分析的工作作為分界線,前段屬萌芽時期,基本上沒有超出描述性統計量的範圍。後一階段可算作是數理統計學的幼年階段。首先,強調了推斷的地位,而擺脫了單純描述的性質。由於高斯等的工作揭示了正態分佈的重要性,學者們普遍認為,在實際問題中遇見的幾乎所有的連續變數,都可以滿意地用正態分佈來刻畫。這種觀點使關於正態分佈的統計得到了深入的發展,但延緩了非參數統計的發展。19世紀末,K.皮爾森給出了以他的名字命名的分佈,並給出了估計參數的一種方法——矩法估計。德國的F.赫爾梅特發現了統計上十分重要的x2 分佈。
第二時期:20世紀初到第二次世界大戰結束。這是數理統計學蓬勃發展達到成熟的時期。許多重要的基本觀點和方法,以及數理統計學的主要分支學科,都是在這個時期建立和發展起來的。這個時期的成就,包含了至今仍在廣泛使用的大多數統計方法。在其發展中,以英國統計學家、生物學家費希爾為代表的英國學派起了主導作用。
第三時期:戰後時期。這一時期中,數理統計學在應用和理論兩方面繼續獲得很大的進展。
數理統計學內容龐雜,分支學科很多,難於作出一個周密而無懈可擊的分類。大體上可以劃分為如下幾類:
第一類分支學科是抽樣調查和試驗設計。它們主要討論在觀測和實驗數據的收集中有關的理論和方法問題,但並非與統計推斷無關。
第二類分支學科為數甚多,其任務都是討論統計推斷的原理和方法。各分支的形成是基於:
③特定的理論模型或樣本結構,如非參數統計、多元統計分析、回歸分析、相關分析、序貫分析,時間序列分析和隨機過程統計。
第三類是一些針對特殊的應用問題而發展起來的分支學科,如產品抽樣檢驗、可靠性統計、統計質量管理等。
統計工作諸環節
用數理統計方法去解決一個實際問題時,一般有如下幾個步驟 :建立數學模型 ,收集整理數據,進行統計推斷、預測和決策。這些環節不能截然分開,也不一定按上述次序,有時是互相交錯的。
①模型的選擇和建立。在數理統計學中,模型是指關於所研究總體的某種假定,一般是給總體分佈規定一定的類型。建立模型要依據概率的知識、所研究問題的專業知識、以往的經驗以及從總體中抽取的樣本(數據)。
②數據的收集。有全面觀測、抽樣觀測和安排特定的實驗3種方式。全面觀測又稱普查,即對總體中每個個體都加以觀測,測定所需要的指標。抽樣觀測又稱抽查,是指從總體中抽取一部分,測定其有關的指標值。這方面的研究內容構成數理統計的一個分支學科。叫抽樣調查。
③安排特定實驗以收集數據,這些特定的實驗要有代表性,並使所得數據便於進行分析。這裡面所包含的數學問題,構成數理統計學的又一分支學科,即實驗設計的內容。
④數據整理。目的是把包含在數據中的有用信息提取出來 。 一種形式是制定適當的圖表,如散點圖,以反映隱含在數據中的粗略的規律性或一般趨勢。另一種形式是計算若幹數字特征,以刻畫樣本某些方面的性質,如樣本均值、樣本方差等簡單描述性統計量。
⑤統計推斷。指根據總體模型以及由總體中抽出的樣本,作出有關總體分佈的某種論斷 。數據的收集和整理是進行統計推斷的必要準備,統計推斷是數理統計學的主要任務。
⑥統計預測。統計預測的對象,是隨機變數在未來某個時刻所取的值,或設想在某種條件下對該變數進行觀測時將取的值。例如,預測一種產品在未來3年內的市場銷售量,某個10歲男孩在3年後的身高,體重等等。
⑦統計決策。依據所做的統計推斷或預測,並考慮到行動的後果(以經濟損失的形式表示)而制定的一種行動方案。目的是使損失儘可能小,或反過來說,使收益儘可能大。例如,一個商店要決定今年內某種產品的進貨數量,商店的統計學家根據抽樣調查,預測該產品本店今年銷售量為1000件。假定每積壓一件產品損失20元,而少銷售一件產品則損失10元,要據此作出關於進貨數量的決策。
數理統計方法在工農業生產、自然科學和技術科學以及社會經濟領域中都有廣泛的應用。
①在農業中,對田間試驗進行適當的設計和統計分析。
②實驗設計法、回歸設計和回歸分析、方差分析、多元分析等統計方法,在工業生產的試製新產品和改進老產品、改革工藝流程、使用代用原材料和尋求適當的配方等問題中起著廣泛的作用,統計質量管理在控制工業產品的質量中起著十分重要的作用。
③醫學是較早使用數理統計方法的領域之一 。在防治一種疾病時,需要找出導致這種疾病的種種因素。統計方法在發現和驗證這些因素上,是一個重要工具。另一方面的應用是,用統計方法確定一種藥物對治療某種疾病是否有用,用處多大,以及比較幾種藥物或治療方法的效力。
④在自然科學和技術科學中,如統計方法用於地震、氣象和水文方面的預報、地質資源的評介等。
⑤在社會、經濟領域方面,如人口調查和預測,心理學中能力方面的分析等。