PPS抽样调查法
出自 MBA智库百科(https://wiki.mbalib.com/)
PPS抽样调查法( Probability Proportionate to Size Sampling)又称,按规模大小成比例的概率抽样/PPS抽样
目录 |
按规模大小成比例的概率抽样,简称为PPS抽样,它是一种使用辅助信息,从而使每个单位均有按其规模大小成比例的被抽中概率的一种抽样方式。其抽选样本的方法有汉森-赫维茨方法、拉希里方法等。
PPS 抽样是指按概率比例抽样,属于概率抽样中的一种。是指在多阶段抽样中,尤其是二阶段抽样中,初级抽样单位被抽中的机率取决于其初级抽样单位的规模大小,初级抽样单位规模越大,被抽中的机会就越大,初级抽样单位规模越小,被抽中的机率就越小。就是将总体按一种准确的标准划分出容量不等的具有相同标志的单位在总体中不同比率分配的样本量进行的抽样。
PPS抽样的目的和设定[1]
选择一个具体的统计抽样方式需要:(1)、从样本得出的结论能反映审计者的测试目的;(2)、设定的方式要和会计总体的特性相匹配。PPS抽样是设计用来为审计者找出审计的总体中存在错误的货币数量(包括夸大和缩小错误)。用PPS进行实质性测试是第五章介绍的变量抽样方法的另一种普遍采用的方法。PPS抽样产生的结论与下述相似:抽样结果证明有X%可靠性,在某会计核算中错误的、货币总数不超过¥Y(Y取决于抽样结果),审计人员将¥Y与可认可的错误进行比较作出可否认可会计帐面值的决定。
市场调查方法 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
[编辑] |
审计人员在决定采用PPS抽样方式之前,应该确定设定的模式是不是适用被测试的会计总体。采用PPS抽样方式有两个条件:
l、会计总体中错误率应较小(小于10%),并且会计总体中至少要包含2000个项目,并使用泊松概率分布去评估样本;
2、任何项目中的错误量不能超过该项目的会计帐面值。
如果设定的PPS抽样方式适用于会计总体测试并使用方式得出的结论符合审计目标,那么审讦人员应考虑采用PPS抽样。
PPS抽样的基本概况 [1]
PPS抽样变种于属性抽样,用于找出在会计总体中全体货币量的错误数。不像传统的属性抽样方法那样着眼于会计总体的物理单元(发票、支票),PPS抽样的着眼点在货币单元。假设抽样审计被审单位有5000个独立的往来帐,会计总体值为¥100,000的帐簿,审计人员将用货币单元取代5,000个物理单元作为抽样体单位。
当一个独立的货币数被抽选出来考核j并不是这个货币数本身被测试。实质上它的作用是一个钩子,把它所在的那个完整的项目(物理单元)拖出来,让审计人员去测试。象第二章讨论的那样,为此审计人员必须累加全体的货币数。为了说明这种方法,下面列举了一部分总体项目的名单:
项目号数 | 帐面价值 | 累加和 | 货币单位关系 |
1 | ¥50 | ¥50 | 1~50 |
2 | ¥100 | ¥150 | 51~150 |
3 | ¥80 | ¥230 | 15l~230 |
4 | ¥200 | ¥430 | 23l~430 |
5 | ¥300 | ¥730 | 431~730 |
如果第250元被选中,那么审计人员将挑出第四号项目进行审计…这是因为250元在23l元至-43P元区间内。这种选择方法的结果在抽选项目时抽中的概率与它的太小有一种直接的关系,即¥100项目比¥lO项目有大十倍的被选中的概率。最终样本中大项目比小项目有高的百分含量。在这点上,PPS抽样与分层抽样相似,即对有大货币面值的项目给它大的抽样份额(权数)。
当某个物理单元符合抽样要求,审计人员将典体检查该项目。如果从该单元中找出了差错,那么这个单元将叫做污点。用t表示相对错误,它等于该单元的错误数值除以该单元的会计帐面记录。
t= | 错误量 | |
该单元的记录数(BV) |
t的均值告诉了审计人员该物理单元电每个货币单元的错误成分+.具体地说,t值提供给审计人员的是该样本项目中每令货币单元的错误量。例如一个被审单位的帐面余额为¥100,其中¥50被夸大(审计值¥50),那么:
据此,审计人员可确定该被审单位的帐面余额的每个货币单元的错误值为¥0.5。相对错误t在抽样中用来决定测试结果。错误分为夸大错误和缩小错误两组。在每二组中,t值将按降序排序。例如,如果两个错误产生韵相对错值分别为0.37和0.42,不论其帐面价值是多少,0.42为tl,0.37为t2。
在排序完成后,、泊松概率分布将在一个规定的风险水平SR(Set risk)上去评估抽样结果。在给定的可靠性程度下,根据审计发现的会计夸大错误和缩小错误去评估会计总体最大的货币错误值。据此,审计人员可以对会计总体作出这样的决定:没有实质错误而接受或者有具体错误数值而被拒绝。
PPS抽样的公式刘德寰著. 市场调查. 北京市:经济管理出版社, 2000. PPS(Probility proportional to size ) 抽样在社会、经济和人口调查中经常使用,它是将总体按一种标准划分出容量不等的具有相同标志的单位在总体中不同比率分配的样本量进行的抽样,在层内,再采取概率、等比例或不等比例等方法再次选择具体样本。PPS 抽样是一种分层抽样与简单随机抽样或者不等比例抽样相配合的两阶段抽样,有时也进一步进行多阶段抽样。在第一阶段,根据样本所在层的大小,给予各个群不同的中选概率,然后在第二阶段的各个层内以等样本量的方法抽取样本。
它的公式是:
其中,Mosa是各个群的样本规模,b群是每个群所需要抽取的样本量,F是总体中每多少个数量抽取一个样本的代表值,f 为抽样比例。
这种方法最根本的优点是能够较大程度地提高抽样精度,较好地推论总体。
PPS抽样的特点是总体中含量大的部分被抽中的概率也大,可以提高样本的代表性。
PPS抽样的主要优点是:使用了辅助信息,减少抽样误差;主要缺点是:对辅助信息要求较高,方差的估计较复杂等。
PPS抽样其具体的做法是:
1、首先确定初级抽样单位(PSU),PSU可以是固定的常规单位,确定PSU需要有这些初级抽样单位的具体名录,以及每个初级抽样单位中被调查人员的具体数目,这个数目可以的估计的人数。
2、确定抽取哪些初级抽样单位,如果初级抽样单位比较少,可以全部抽取,如果初级抽样单位太多,则可以随机抽取部分的抽样单位。
3、在选取的初级抽样单位中选择具体的调查对象,如果将第二步中选取的初级抽样单位的组成人员全部作为调查对象,称为二阶段整群抽样,如果只是在初级抽样单位中按人数的多少,来决定在每个抽样单位中抽取多少人,则称为PPS抽样,此时,需要进行一定的计算,详见有关统计书籍。
PPS抽样的举例[2]
假设要从全市100家企业,总共20万名职工中,抽取1000名职工进行调查。我们采取多段抽样的方法,首先从100家企业中随机抽取若干家企业,如抽取20家;然后再从这20家企业中分别抽取50名职工(50X20=1000)构成样本。需要注意的是,这100家企业的规模是不同的:最大的企业多达16000名职工,而最小的企业则只有200名职工。如果这样的两个企业都选入第一阶段的样本(即都进人20家企业的样本),那么它们在第一阶段的人选概率是相同的,即都为20÷100=20%;但第二阶段从每家企业中抽取职工时,这两家企业中每个职工被抽中的概率却大不一样:前者的概率为50÷16000=0.3125%,而后者的概率则为50÷200=25%。这样,规模大的企业中每个职工被抽中的概率则为20%×0.3125%=0.0625%;而规模小的企业中每个职工被抽中的概率为20%×25%=5%;规模大的企业中的职工相对于规模小的企业中的职工来说,他们被抽中的概率要小得多(后者是前者的80倍)。
为了解决这一问题,我们可以采用PPS的方法,首先将各个元素(即企业)排列起来,然后写出它们的规模、计算它们的规模在总体规模中所占的比例;将它们的比例累计起来,并根据比例的累计数依次写出每一元素所对应的选择号码范围(该范围的大小等于元素规模所占的比例),然后采用随机数表的方法或系统抽样的方法选择号码,号码所对应的元素人选第一阶段样本。最后再从所选样本中进行第二阶段抽样(即从每个被抽中的元素中抽取50名职工)。由于规模大的企业其所对应的选择号码范围也大,而选样号码范围大时,被抽中的概率也大(有些特别大的企业还可能抽到不止一个号码,如企业3就抽到两个号码。那么在第二阶段抽样中,就要从企业3中抽取50×2=100名职工)。由于规模大的企业在第一阶段抽样时被抽中的概率大于规模小的企业,这样就补偿了第二阶段抽样时规模大的企业中每个职工被抽中的概率小的情况,使得无论规模大还是规模小的企业中,每个职工总的被抽中的概率都是相等的。所以,这种方法最终抽出的样本对总体的代表性也大。
本条目由以下用户参与贡献
Angle Roh,Zfj3000,Cabbage,Xiaoyou,Zxe,鲈鱼,Dan,Mis铭,M id 0b6caec5eb2e013576ad4a40c16cd645.评论(共19条)
我学过的pps抽样调查是确定抽样样本,然后定下抽样数量,可以分为三组,抽取后均值与均值作比较,误差在10%以内就可以接受,一帮可以用在检测流水线产品.
继续回复,求一详细解释,这么说很难理解
已添加相关信息,希望对您的理解有所帮助
为什么没有举例说明呢,遗憾
添加了一个例子,希望对你有帮助!~
很好 谢谢 举例是正确的 也可以参看艾尔巴比的社会研究方法
请问那个例子的累计一栏是什意思?
对于那个例子,所选号码和人样元素看不懂
企业2对应的累计值是25%,这里错了,应该是2.5%。核心方法其实是根据规模按比例抽,每个被抽取的企业的概率是一样的
感谢提醒,换了一个新图!
然后再从这20家企业中分别抽取50名职工(50X20=1000)构成样本,有些特别大的企业还可能抽到不止一个号码,如企业3就抽到两个号码。那么在第二阶段抽样中,就要从企业3中抽取50×2=100名职工,企业3拿到2个号码,那就不是20家企业,就是19家了
看不懂,能否举个例子?