样本容量

出自 MBA智库百科(http://wiki.mbalib.com/)

(重定向自样本数)

样本容量(sample size)

目录

什么是样本容量

  样本容量又称“样本数”。指一个样本的必要抽样单位数目。在组织抽样调查时,抽样误差的大小直接影响样本指标代表性的大小,而必要的样本单位数目是保证抽样误差不超过某一给定范围的重要因素之一。因此,在抽样设计时,必须决定样本单位数目,因为适当的样本单位数目是保证样本指标具有充分代表性的基本前提。

  样本是从总体中抽出的部分单位集合,这个集合的大小就叫做样本量。一般来说,样本的容量大的话,样本的误差就小。反之则大。通常样本单位数大于30的样本可称为大样本,小于30的样本则称为小样本。在实际应用中,我们应该根据调查的目的认真考虑样本量的大小。

  样本容量的大小涉及到调研中所要包括的单元数。确定样本容量的大小是比较复杂的问题,既要有定性的考虑也要有定量的考虑。从定性的方面考虑样本量的大小,其考虑因素有:决策的重要性,调研的性质,变量个数,数据分析的性质,同类研究中所用的样本量,发生率,完成率,资源限制等。具体地说,更重要的决策,需要更多的信息和更准确的信息,这就需要较大的样本;探索性研究,样本量一般较小,而结论性研究如描述性的调查,就需要较大的样本;收集有关许多变量的数据,样本量就要大一些,以减少抽样误差的累积效应;如果需要采用多元统计方法对数据进行复杂的高级分析,样本量就应当较大;如果需要特别详细的分析,如做许多分类等,也需要大样本。针对子样本分析比只限于对总样本分析,所需样本量要大得多。

样本个数

  所谓样本个数,就是样本可能的数目,指的是从一个总体中可能抽取的样本数。例如一个大小为500的样本,从中抽取100个做抽样调查,则样本个数为100。

样本量的确定公式

  具体确定样本量还有相应的统计学公式,不同的抽样方法对应不同的公式。根据样本量计算公式,我们知道,样本量的大小不取决于总体的多少,而取决于(1) 研究对象的变化程度;(2) 所要求或允许的误差大小(即精度要求);(3) 要求推断的置信程度。也就是说,当所研究的现象越复杂,差异越大时,样本量要求越大;当要求的精度越高,可推断性要求越高时,样本量越大。因此,如果不同城市分别进行推断时,大城市多抽,小城市少抽这种说法原则上是不对的。在大城市抽样太大是浪费,在小城市抽样太少没有推断价值。

  总之,在确定抽样方法和样本量的时候,既要考虑调查的目的、调查性质和精度要求(抽样误差)等,又要考虑实际操作的可实施性,非抽样误差控制、经费预算等。专业调查公司在这方面会根据您的情况及调查性质,进行综合权衡,达到一个最优的样本容量的选择。

样本容量的确定

估计总体均值时样本容量的确定

  1.已知总体方差重复抽样条件下:

  \Delta=Z_{\frac{a}{2}}\frac{\sigma}{\sqrt{n}}

  上式两边整理可得:

  n=\frac{(Z_{\frac{a}{2}})^2\sigma^2}{\Delta^2}

  以上就是在给定极限误差、概率误差要求下,至少应抽取的样本容量。

  2.已知总体方差,不重复抽样条件下:

  \Delta=Z_{\frac{a}{2}}{\frac{\sigma}{\sqrt{n}}}\sqrt{1-\frac{n}{N}}

  上式两边整理可得:

  n=\frac{N(Z_\frac{a}{2})^2\sigma^2}{N\Delta^2+(Z_{\frac{a}{2}})^2\sigma^2}

  在以上公式中,各字母表示意义如下:

  Z:概率度

  N:样本总数

  n:样本容量

  a:极限误差

估计成数时样本容量的确定

  1.重复抽样条件下:

  n=\frac{\left(Z_{\frac{a}{2}}\right)^2P(1-p)}{\Delta P^2}

  2.不重复抽样条件下:

  n=\frac{N\left(Z_{\frac{a}{2}}\right)^2P(1-P)}{N\Delta p^2+\left(Z_{\frac{a}{2}}\right)^2P(1-P)}

  其中各字母的含义如下:

  P:总体成数

  p:样本成数

样本量与样本个数的关系举例

  一个箱子最多能放50个苹果(样本),从中取样30个。

  在这里,苹果是样本,箱子最多能放的个数(即苹果的总数)50是这个样本的样本(容)量,而所抽取的样本个数30则是样本量。   


  

本条目对我有帮助78

分享到:
  如果您认为本条目还有待完善,需要补充新内容或修改错误内容,请编辑条目

本条目由以下用户参与贡献

Kane0135,Angle Roh,Dan,Jiexianhuang,Zfj3000,BIAN Xuanmeng,Mis铭.

评论(共2条)

提示:评论内容为网友针对条目"样本容量"展开的讨论,与本站观点立场无关。
60.247.55.* 在 2011年7月5日 09:36 发表

不重复抽样的分子少了一个N~

回复评论
Dan (Talk | 贡献) 在 2011年7月5日 10:14 发表

60.247.55.* 在 2011年7月5日 09:36 发表

不重复抽样的分子少了一个N~

谢谢指正,已对错误之处做了修改!~

MBA智库百科是可以自由参与的百科,如有发现错误和不足,您也可以参与修改编辑,只要通过网页右上角的创建新帐号,创建用户名后即可参与,期待您的加入!~

回复评论

发表评论请文明上网,理性发言并遵守有关规定。

以上内容根据网友推荐自动排序生成