大數定律

用手机看条目

出自 MBA智库百科(https://wiki.mbalib.com/)

(重定向自大数法则)

大數定律(Law of Large Numbers)

目錄

什麼是大數定律

  大數定律是指在隨機試驗中,每次出現的結果不同,但是大量重覆試驗出現的結果的平均值卻幾乎總是接近於某個確定的值。

  其原因是,在大量的觀察試驗中,個別的、偶然的因素影響而產生的差異將會相互抵消,從而使現象的必然規律性顯示出來。例如,觀察個別或少數家庭的嬰兒出生情況,發現有的生男,有的生女,沒有一定的規律性,但是通過大量的觀察就會發現,男嬰和女嬰占嬰兒總數的比重均會趨於50%。

大數定律的表現形式

  定義1:\varepsilon_n(n=1,2,\cdots)概率空間(Ω,F,P)上定義的隨機變數序列(簡稱隨機序列),若存在隨機變數\varepsilon,使對任意\varepsilon>0,恆有:

\lim_{n\to\infty}p{|\varepsilon_n-\varepsilon|\ge\varepsilon}=0
\lim_{n\to\infty}p{|\varepsilon_n-\varepsilon|\le\varepsilon}=1

  則稱隨機序列{\varepsilon_n}依概率收斂於隨機變數\varepsilon(\varepsilon也可以是一個常數),並用下麵的符號表示:

  \lim_{n\to\infty}\varepsilon_n=\varepsilon(p)\varepsilon_n\overrightarrow{p}\varepsilon

  定義2:{\varepsilon_n}為一隨機序列,數學期望E(\varepsilon_n))存在,令\bar{\varepsilon_n}= \frac{1}{n}\sum_{i=1}^n \varepsilon_i,若\lim_{n\to\infty}[\bar{\varepsilon_n}-E(\bar{\varepsilon_n})]=0(P),則稱隨機序列{\varepsilon_n}服從大數定律,或者說大數法則成立。

  定義3:Fn(x)是分佈函數序列,若存在一個非降函數F(x),對於它的每一連續點x,都有\lim_{n\to\infty}F_n(x)=F(x),F_n(x)\overrightarrow{w}F(x),則稱分佈函數序列Fn(x)弱收斂於F(x)。

  定義4:F_n(x)(n=1,2,3,\cdots),F(x)分別是隨機變數\varepsilon_n(n=1,2,3,\cdots)\varepsilon的分佈函數,若F_n(x)\overrightarrow{w}F(x),則稱{\varepsilon_n}依分佈收斂於\varepsilon,亦記為\varepsilon_n\overrightarrow{L}\varepsilon,且有:(1)若\varepsilon_n\overrightarrow{P}\varepsilon,則\varepsilon_n\overrightarrow{L}\varepsilon;(2)設c為常數,則 \varepsilon_n\overrightarrow{P}c的充要條件是\varepsilon_n\overrightarrow{L}c

  逆極限定理:設特征函數列fn(t)收斂於某一函數f(t),且f(t)在t=0時連續,則相應的分佈函數列Fn(x)弱收斂於某一分佈函數F(x),而且f(t)是F(x)的特征函數。

  大數定律有若幹個表現形式。這裡僅介紹其中常用的兩個重要定律:

  (一)切貝雪夫大數定理

  設x_1,x_2\cdots是一列兩兩相互獨立的隨機變數,服從同一分佈,且存在有限的數學期望a和方差σ2,則對任意小的正數ε,有:

  \lim_{n\to\infty}P(|\frac{\sum x_i}{n}-a<\varepsilon|)=1

  該定律的含義是:當n很大,服從同一分佈的隨機變數x_1,x_2\cdots,x_n算術平均數\frac{\sum x_i}{n}將依概率接近於這些隨機變數的數學期望。

  將該定律應用於抽樣調查,就會有如下結論:隨著樣本容量n的增加,樣本平均數將接近於總體平均數。從而為統計推斷中依據樣本平均數估計總體平均數提供了理論依據。

  (二)貝努里大數定律

  設μn是n次獨立試驗中事件A發生的次數,且事件A在每次試驗中發生的概率為P,則對任意正數ε,有:

  \lim_{n\to\infty}P(|\frac{\mu_n}{n}-p<\varepsilon|)=1

  該定律是切貝雪夫大數定律的特例,其含義是,當n足夠大時,事件A出現的頻率將幾乎接近於其發生的概率,即頻率的穩定性。

  在抽樣調查中,用樣本成數去估計總體成數,其理論依據即在於此。

相關條目

本條目對我有幫助99
MBA智库APP

扫一扫,下载MBA智库APP

分享到:
  如果您認為本條目還有待完善,需要補充新內容或修改錯誤內容,請編輯條目

本条目由以下用户参与贡献

Zfj3000,Kane0135,Vulture,Tracy.

評論(共3條)

提示:評論內容為網友針對條目"大數定律"展開的討論,與本站觀點立場無關。
124.165.26.* 在 2012年1月12日 18:14 發表

嗯,不錯有很多,很完整,頂。

回複評論
117.136.75.* 在 2016年11月21日 00:35 發表

隨機是以檢測為目的,大數據里只有人工智慧領域掌控,而我們擇優取捨與改良再生迴圈掌握。人工與智能是雙向機智相輔配合關係,人工智慧優勢是人類無法普及,優秀的產品往往在先瞭解智能屬性優劣後產生。人工智慧通過知識數據的積累與沉澱飛速的在成長,但除知識面豐富外諸多領域幾乎弱智或空白,對人性的理解和社會的世態冷暖一無所知,多以書面娛樂態性和古板倫理依章配製而行,缺乏機變記錄個主體的習性應對,導致適得其反甚至糧造悲劇的損失。

回複評論
221.15.26.* 在 2019年4月7日 15:50 發表

隨機變數序列的均值,依概率收斂於自己的期望

回複評論

發表評論請文明上網,理性發言並遵守有關規定。

MBA智库
打开APP

以上内容根据网友推荐自动排序生成