大数定律

出自 MBA智库百科(http://wiki.mbalib.com/)

(重定向自大数法则)

大数定律(Law of Large Numbers)

目录

什么是大数定律

  大数定律是指在随机试验中,每次出现的结果不同,但是大量重复试验出现的结果的平均值却几乎总是接近于某个确定的值。

  其原因是,在大量的观察试验中,个别的、偶然的因素影响而产生的差异将会相互抵消,从而使现象的必然规律性显示出来。例如,观察个别或少数家庭的婴儿出生情况,发现有的生男,有的生女,没有一定的规律性,但是通过大量的观察就会发现,男婴和女婴占婴儿总数的比重均会趋于50%。

大数定律的表现形式

  定义1:\varepsilon_n(n=1,2,\cdots)概率空间(Ω,F,P)上定义的随机变量序列(简称随机序列),若存在随机变数\varepsilon,使对任意\varepsilon>0,恒有:

\lim_{n\to\infty}p{|\varepsilon_n-\varepsilon|\ge\varepsilon}=0
\lim_{n\to\infty}p{|\varepsilon_n-\varepsilon|\le\varepsilon}=1

  则称随机序列{\varepsilon_n}依概率收敛于随机变量\varepsilon(\varepsilon也可以是一个常数),并用下面的符号表示:

  \lim_{n\to\infty}\varepsilon_n=\varepsilon(p)\varepsilon_n\overrightarrow{p}\varepsilon

  定义2:{\varepsilon_n}为一随机序列,数学期望E(\varepsilon_n))存在,令\bar{\varepsilon_n}= \frac{1}{n}\sum_{i=1}^n \varepsilon_i,若\lim_{n\to\infty}[\bar{\varepsilon_n}-E(\bar{\varepsilon_n})]=0(P),则称随机序列{\varepsilon_n}服从大数定律,或者说大数法则成立。

  定义3:Fn(x)是分布函数序列,若存在一个非降函数F(x),对于它的每一连续点x,都有\lim_{n\to\infty}F_n(x)=F(x),F_n(x)\overrightarrow{w}F(x),则称分布函数序列Fn(x)弱收敛于F(x)。

  定义4:F_n(x)(n=1,2,3,\cdots),F(x)分别是随机变量\varepsilon_n(n=1,2,3,\cdots)\varepsilon的分布函数,若F_n(x)\overrightarrow{w}F(x),则称{\varepsilon_n}依分布收敛于\varepsilon,亦记为\varepsilon_n\overrightarrow{L}\varepsilon,且有:(1)若\varepsilon_n\overrightarrow{P}\varepsilon,则\varepsilon_n\overrightarrow{L}\varepsilon;(2)设c为常数,则 \varepsilon_n\overrightarrow{P}c的充要条件是\varepsilon_n\overrightarrow{L}c

  逆极限定理:设特征函数列fn(t)收敛于某一函数f(t),且f(t)在t=0时连续,则相应的分布函数列Fn(x)弱收敛于某一分布函数F(x),而且f(t)是F(x)的特征函数。

  大数定律有若干个表现形式。这里仅介绍其中常用的两个重要定律:

  (一)切贝雪夫大数定理

  设x_1,x_2\cdots是一列两两相互独立的随机变量,服从同一分布,且存在有限的数学期望a和方差σ2,则对任意小的正数ε,有:

  \lim_{n\to\infty}P(|\frac{\sum x_i}{n}-a<\varepsilon|)=1

  该定律的含义是:当n很大,服从同一分布的随机变量x_1,x_2\cdots,x_n算术平均数\frac{\sum x_i}{n}将依概率接近于这些随机变量的数学期望。

  将该定律应用于抽样调查,就会有如下结论:随着样本容量n的增加,样本平均数将接近于总体平均数。从而为统计推断中依据样本平均数估计总体平均数提供了理论依据。

  (二)贝努里大数定律

  设μn是n次独立试验中事件A发生的次数,且事件A在每次试验中发生的概率为P,则对任意正数ε,有:

  \lim_{n\to\infty}P(|\frac{\mu_n}{n}-p<\varepsilon|)=1

  该定律是切贝雪夫大数定律的特例,其含义是,当n足够大时,事件A出现的频率将几乎接近于其发生的概率,即频率的稳定性。

  在抽样调查中,用样本成数去估计总体成数,其理论依据即在于此。

相关条目

本条目对我有帮助89

分享到:
  如果您认为本条目还有待完善,需要补充新内容或修改错误内容,请编辑条目

本条目由以下用户参与贡献

Zfj3000,Kane0135,Vulture,Tracy.

评论(共2条)

提示:评论内容为网友针对条目"大数定律"展开的讨论,与本站观点立场无关。
124.165.26.* 在 2012年1月12日 18:14 发表

嗯,不错有很多,很完整,顶。

回复评论
117.136.75.* 在 2016年11月21日 00:35 发表

随机是以检测为目的,大数据里只有人工智能领域掌控,而我们择优取舍与改良再生循环掌握。人工与智能是双向机智相辅配合关系,人工智能优势是人类无法普及,优秀的产品往往在先了解智能属性优劣后产生。人工智能通过知识数据的积累与沉淀飞速的在成长,但除知识面丰富外诸多领域几乎弱智或空白,对人性的理解和社会的世态冷暖一无所知,多以书面娱乐态性和古板伦理依章配制而行,缺乏机变记录个主体的习性应对,导致适得其反甚至粮造悲剧的损失。

回复评论

发表评论请文明上网,理性发言并遵守有关规定。

以上内容根据网友推荐自动排序生成