百分位数

用手机看条目

出自 MBA智库百科(https://wiki.mbalib.com/)

百分位数(Percentile)

目录

什么是百分位数

  百分位数又称百分位分数(percentile),是一种相对地位量数,它是次数分布中的一个点。把一个次数分布排序后,分为100个单位,百分位数就是次数分布中相对于某个特定百分点的原始分数,它表明在次数分布中特定个案百分比低于该分数。百分位数用P加下标m(特定百分点)表示。譬如,若P30等于60,则其表明在该次数分布中有30%的个案低于60分。

百分位数的应用[1]

  百分位数用于描述一组数据某一百分位置的水平,多个百分位数结合应用,可全面描述一组观察值的分布特征;百分位数还可用于确定非正态分布资料的医学参考值范围。但应用百分位数时,样本含量要足够大,否则不宜取太靠近两端的百分位数。

百分位数的计算

  P_m = L + \frac{\frac{m}{100} \times N - F_b}{f} \times i

  P_m = U - \frac{N(1-\frac{m}{100}) - F_a}{f} \times i

  其中,Pm——第m百分位数;

  L——Pm所在组的组实下限;

  U——Pm所在组的组实上限;

  f——Pm所在组的次数

  Fb——小于L的累积次数;

  Fa——大于U的累积次数。

  【例1】某省某年公务员考试考生分数分布如下表所示,预定取考分居前15%的考生进行面试选拔,请划定面试分数线。

分数分组次数向上累积次数向下累积次数向上累积相对次数
95~99716407100%
90~941616332399.57%
85~895316177698.60%
80~8478156415495.37%
75~7990148624490.61%
70~74119l39636385.12%
65~69159127752277.87%
60~64156111867868.17%
55~5914096281858.66%
50~5414582296350.12%
45~49140677110341.28%
40~44135537123832.74%
35~39130402136824.51%
30~34126272149416.59%
25~297814615728.90%
20~24256815974.15%
15~19204316172.62%
10~14162316331.40%
5~97716400.43%

  解:由于预定取考分居前15%的考生进行面试,即有85%的考生分数低于划定的分数线,由此可知,分数线在70~74这一组中。

  P_{85} = L + \frac{\frac{m}{100} \times N - F_b}{f} \times i = 69.5 + \frac{\frac{85}{100} \times 1640 - 1277}{119} \times 5 = 74.4

  【例2】对于考试成绩的统计,如果您的成绩处在95的百分位数上,则意味着95%的参加考试者得到了和您一样的考分或还要低的考分,而不是您答对了95%的试题。也许您只答对了20%,即使如此,您取得的成绩也与95%的参加考试者一样好,或者比95%的参加考试者更好[2]

  【例3】假设想为退休存够钱。可创建一个包括所有不确定变量的模型,如投资年回报率、通货膨胀、退休时的开支等,得到概率分布的结果如下图所示,如果选择平均值,钱不够的概率就会有50%。所以选第90百分位数所对应的投资数,这样钱不够的概率将只有10%[2]

Image:正态分布的百分位数.jpg

参考文献

  1. 丁元林,高歌.卫生统计学.科学出版社,2008.07.
  2. 2.0 2.1 顾祥柏,耿志强.石油化工节能减排智能管理.化学工业出版社,2011.08.
  • 徐文彬.第三节 百分位数与百分等级数 第四章 数据的离中趋势及其描述 教育统计学:思想、方法与应用.南京师范大学出版社,2007.3
本条目对我有帮助87
MBA智库APP

扫一扫,下载MBA智库APP

分享到:
  如果您认为本条目还有待完善,需要补充新内容或修改错误内容,请编辑条目

本条目由以下用户参与贡献

Zfj3000,Dan,泡芙小姐.

评论(共15条)

提示:评论内容为网友针对条目"百分位数"展开的讨论,与本站观点立场无关。
125.32.73.* 在 2010年7月25日 07:40 发表

到底是从大到小排列还是从小到大排列,刚开始说从大到小,举例又是从小到大的,看着晕!

回复评论
222.211.196.* 在 2010年8月6日 16:53 发表

125.32.73.* 在 2010年7月25日 07:40 发表

到底是从大到小排列还是从小到大排列,刚开始说从大到小,举例又是从小到大的,看着晕!

应该是从小到大排列。

回复评论
58.212.98.* 在 2010年9月16日 18:27 发表

求指数是啥意思啊

回复评论
222.243.125.* 在 2011年8月15日 16:46 发表

i=np%是啥意思呀 p50所对应的数据是不是就是均值呢?

回复评论
Dan (Talk | 贡献) 在 2011年8月17日 16:17 发表

222.243.125.* 在 2011年8月15日 16:46 发表

i=np%是啥意思呀 p50所对应的数据是不是就是均值呢?

添加和修改了部分内容,希望对你有帮助!~

回复评论
58.96.98.* 在 2012年3月12日 16:03 发表

计算中算出百分位数所在位置大于最大值,该怎么办? 如题 46,54,42,46,32的p97是多少?

回复评论
110.80.33.* 在 2012年3月13日 13:51 发表

58.96.98.* 在 2012年3月12日 16:03 发表

计算中算出百分位数所在位置大于最大值,该怎么办? 如题 46,54,42,46,32的p97是多少?

应该不存在这个问题吧,你的题中只有五个数,m值不能设97,个案数是整数,要么20%40%之类的,应该是你算错了把!

回复评论
吉利 (Talk | 贡献) 在 2013年1月26日 14:38 发表

例题有点乱

回复评论
泡芙小姐 (Talk | 贡献) 在 2013年1月28日 10:17 发表

吉利 (Talk | 贡献) 在 2013年1月26日 14:38 发表

例题有点乱

  已添加案例并附上参考文献,希望对您有帮助。

  MBA智库百科是可以自由参与的百科,如有发现错误和不足,您也可以参与修改编辑,点击条目上方的编辑进入即可参与,期待您的加入!~

回复评论
42.66.213.* 在 2015年2月4日 16:22 发表

所以百分位數和百分等級有什麼差別?Pr80就等於百分位數80嗎!?

回复评论
223.136.14.* 在 2015年10月1日 22:07 发表

請問:如果班上共有50個學生,而其分數是100分的有20個,99分的20個,98分的有9個,97分的有1個,那麼求第97百分位數P97=?

回复评论
115.182.230.* 在 2015年10月13日 15:57 发表

什么是组实上限 和组实下限?

回复评论
西蒙雨 (Talk | 贡献) 在 2016年11月11日 02:17 发表

我以例1为例来详细探讨一下。 首先要说明本词条中例1的解题计算是错误的! 其次不要被公式搞晕,公式是从概念中提炼出来的,理解了概念就明白了公式。反之,想从公式入手就比较抽象枯燥。

进入正题。 1.例1在现实应用中是什么意思呢? 其实就是1640个考生参加了公务员考试并取得有效成绩(最低分5分),如何计算出分数居考生总数前15%的考生的录取成绩呢? 也就是第85个百分位数的成绩,换句话说1640名考生中85%的人应当低于这个成绩。

2.理解表格的含义 1)分数分组(i,L,U) 考务人员将考试成绩按5分的差距(i)进行了分数分组,应该有100/5=20个组。 但是本例中显然去掉了最低一级“0~4”分这个组别,这是一个很好的例子。 一种可能是所有的考生都没有低于5分的,另一种可能是根本不考虑5分以下的。 在这列数据中包含了3个公式变量:i,L,U。 i:分数分组区间差; L:分数分组区间下限; U:分数分组区间上限。 这里有个重要问题要说明一下!每一个“分数分组”项中数据值的下限值就是该数据的值,而上限值应当是数值加1。 怎么理解这句话呢?以表中第二行记录“90~94”为例, 它代表的真正含义是90分(含)以上,95分(不含)以下成绩范围,而不是90~94分之间的成绩,否则94.5分往哪儿放? 忽略这一点,用第二个公式计算就无法得到正确的答案。

2)次数 (f,N) 次数即统计次数(f),在本例中可以理解为对应分数段的统计人数。 第一行数据表示95分(含)以上的考生一共7人; 第二行数据表示90分(含)以上、95分(不含)以下的考生一共为16人,以此类推。 所有各行次数累计的总和N,也就是统计总数。 本例中所有次数的总和N为1640人。

3)向上累积次数(Fb) 即从低分数段向高分数段依次将对应次数进行累加。 10分以下的7人;15分以下的7+16=23人;20分以下的23+20=43人......

4)向下累积次数(Fa) 即从高分数段向低分数段依次将对应次数进行累加。 95分以上的7人;90分以上的7+16=23人;85分以上的23+53=76人......

5)向上累积相对次数(m%) 即“向上累积次数”与总人数N的百分比,也就是百分位数。 例第四行数据“95.37%”的含义是:1564名考试成绩在85分以下,占全部1640名考生的95.37% 第六行的意思是85.12百分位数的考生成绩在75分以下,共有1396人。

3.如何计算 1)首先以例题中取前15%的考生为例进行计算。 两个公式都可以用,先以第一个公式进行计算。 前15%也就是找到第85(m)个百分位数,表格第五列中并没有85%这个数, 但是我们能够找到包含85%——第六行的“85.12%”,也就是寻找第一个大于85%的数据。 (如果我们想录取前5%的考生,找到的对应数据就是第四行的“95.37%”。) 那么在70分(L)和75分(U)之间我们到底要取多少分才能保证刷掉的人数正好占总人数的85%呢? 计算: a)总人数1640的85%是1394人;(m/100*N) b)70分以下的是1277人,1394-1277=117人。也就是从70~75分之间的这119人中还要刷掉117人。(m/100*N-Fb) c)这117人与该区间总人数119人的对应比重的分值=117/119*5=4.92。((m/100*N-Fb)/f*i) d)第85个百分位数对应分数=70+4.92=74.92分。(L+(m/100*N-Fb)/f*i) e)正确答案为录取成绩为74.92分。 用公式二进行检验: U=75,N=1640,m=85,Fa=244,f=119,i=5 P75=75-(1640*(1-85/100)-244)/119*5=74.92

2)假如我们只录取前5%的考生,即计算出第95个百分位所对应的成绩。 找到第四行数据,获得L=80, m=95, N=1640, Fb=1486, f=78, i=5 P95=80+(95/100*1640-1486)/78*5=84.62

4.补充说明 其实我们计算出来的数值只是参考数值。如本例录取前15%成绩的246人中,244人肯定高于录取成绩74.92分,另外2人是否能达到这个成绩就不好说。 这也从另一个侧面说明了i取值大小的意义了。取值越大计算误差越大,但是统计工作量越小;取值越小则反之。

回复评论
西蒙雨 (Talk | 贡献) 在 2016年11月11日 02:30 发表

223.136.14.* 在 2015年10月1日 22:07 发表

請問:如果班上共有50個學生,而其分數是100分的有20個,99分的20個,98分的有9個,97分的有1個,那麼求第97百分位數P97=?

你这个例子比较极端,不过按照你的题目计算 P97=99.5+(97%*50-30)/20*0.5=99.96

回复评论
117.136.81.* 在 2017年5月31日 11:03 发表

222.243.125.* 在 2011年8月15日 16:46 发表

i=np%是啥意思呀 p50所对应的数据是不是就是均值呢?

50%的是中位数,怎么会是均值呢!他们不一定相等

回复评论

发表评论请文明上网,理性发言并遵守有关规定。

打开APP

以上内容根据网友推荐自动排序生成