百分位數
出自 MBA智库百科(https://wiki.mbalib.com/)
百分位數(Percentile)
目錄 |
百分位數又稱百分位分數(percentile),是一種相對地位量數,它是次數分佈中的一個點。把一個次數分佈排序後,分為100個單位,百分位數就是次數分佈中相對於某個特定百分點的原始分數,它表明在次數分佈中特定個案百分比低於該分數。百分位數用P加下標m(特定百分點)表示。譬如,若P30等於60,則其表明在該次數分佈中有30%的個案低於60分。
百分位數的應用[1]
百分位數用於描述一組數據某一百分位置的水平,多個百分位數結合應用,可全面描述一組觀察值的分佈特征;百分位數還可用於確定非正態分佈資料的醫學參考值範圍。但應用百分位數時,樣本含量要足夠大,否則不宜取太靠近兩端的百分位數。
其中,Pm——第m百分位數;
L——Pm所在組的組實下限;
U——Pm所在組的組實上限;
f——Pm所在組的次數;
Fb——小於L的累積次數;
Fa——大於U的累積次數。
【例1】某省某年公務員考試考生分數分佈如下表所示,預定取考分居前15%的考生進行面試選拔,請劃定面試分數線。
分數分組 | 次數 | 向上累積次數 | 向下累積次數 | 向上累積相對次數 |
---|---|---|---|---|
95~99 | 7 | 1640 | 7 | 100% |
90~94 | 16 | 1633 | 23 | 99.57% |
85~89 | 53 | 1617 | 76 | 98.60% |
80~84 | 78 | 1564 | 154 | 95.37% |
75~79 | 90 | 1486 | 244 | 90.61% |
70~74 | 119 | l396 | 363 | 85.12% |
65~69 | 159 | 1277 | 522 | 77.87% |
60~64 | 156 | 1118 | 678 | 68.17% |
55~59 | 140 | 962 | 818 | 58.66% |
50~54 | 145 | 822 | 963 | 50.12% |
45~49 | 140 | 677 | 1103 | 41.28% |
40~44 | 135 | 537 | 1238 | 32.74% |
35~39 | 130 | 402 | 1368 | 24.51% |
30~34 | 126 | 272 | 1494 | 16.59% |
25~29 | 78 | 146 | 1572 | 8.90% |
20~24 | 25 | 68 | 1597 | 4.15% |
15~19 | 20 | 43 | 1617 | 2.62% |
10~14 | 16 | 23 | 1633 | 1.40% |
5~9 | 7 | 7 | 1640 | 0.43% |
解:由於預定取考分居前15%的考生進行面試,即有85%的考生分數低於劃定的分數線,由此可知,分數線在70~74這一組中。
【例2】對於考試成績的統計,如果您的成績處在95的百分位數上,則意味著95%的參加考試者得到了和您一樣的考分或還要低的考分,而不是您答對了95%的試題。也許您只答對了20%,即使如此,您取得的成績也與95%的參加考試者一樣好,或者比95%的參加考試者更好[2]。
【例3】假設想為退休存夠錢。可創建一個包括所有不確定變數的模型,如投資年回報率、通貨膨脹、退休時的開支等,得到概率分佈的結果如下圖所示,如果選擇平均值,錢不夠的概率就會有50%。所以選第90百分位數所對應的投資數,這樣錢不夠的概率將只有10%[2]。
- 徐文彬.第三節 百分位數與百分等級數 第四章 數據的離中趨勢及其描述 教育統計學:思想、方法與應用.南京師範大學出版社,2007.3
評論(共17條)
到底是從大到小排列還是從小到大排列,剛開始說從大到小,舉例又是從小到大的,看著暈!
應該是從小到大排列。
i=np%是啥意思呀 p50所對應的數據是不是就是均值呢?
添加和修改了部分內容,希望對你有幫助!~
計算中算出百分位數所在位置大於最大值,該怎麼辦? 如題 46,54,42,46,32的p97是多少?
應該不存在這個問題吧,你的題中只有五個數,m值不能設97,個案數是整數,要麼20%40%之類的,應該是你算錯了把!
已添加案例並附上參考文獻,希望對您有幫助。
MBA智庫百科是可以自由參與的百科,如有發現錯誤和不足,您也可以參與修改編輯,點擊條目上方的編輯進入即可參與,期待您的加入!~
請問:如果班上共有50個學生,而其分數是100分的有20個,99分的20個,98分的有9個,97分的有1個,那麼求第97百分位數P97=?
我以例1為例來詳細探討一下。 首先要說明本詞條中例1的解題計算是錯誤的! 其次不要被公式搞暈,公式是從概念中提煉出來的,理解了概念就明白了公式。反之,想從公式入手就比較抽象枯燥。
進入正題。 1.例1在現實應用中是什麼意思呢? 其實就是1640個考生參加了公務員考試並取得有效成績(最低分5分),如何計算出分數居考生總數前15%的考生的錄取成績呢? 也就是第85個百分位數的成績,換句話說1640名考生中85%的人應當低於這個成績。
2.理解表格的含義 1)分數分組(i,L,U) 考務人員將考試成績按5分的差距(i)進行了分數分組,應該有100/5=20個組。 但是本例中顯然去掉了最低一級“0~4”分這個組別,這是一個很好的例子。 一種可能是所有的考生都沒有低於5分的,另一種可能是根本不考慮5分以下的。 在這列數據中包含了3個公式變數:i,L,U。 i:分數分組區間差; L:分數分組區間下限; U:分數分組區間上限。 這裡有個重要問題要說明一下!每一個“分數分組”項中數據值的下限值就是該數據的值,而上限值應當是數值加1。 怎麼理解這句話呢?以表中第二行記錄“90~94”為例, 它代表的真正含義是90分(含)以上,95分(不含)以下成績範圍,而不是90~94分之間的成績,否則94.5分往哪兒放? 忽略這一點,用第二個公式計算就無法得到正確的答案。
2)次數 (f,N) 次數即統計次數(f),在本例中可以理解為對應分數段的統計人數。 第一行數據表示95分(含)以上的考生一共7人; 第二行數據表示90分(含)以上、95分(不含)以下的考生一共為16人,以此類推。 所有各行次數累計的總和N,也就是統計總數。 本例中所有次數的總和N為1640人。
3)向上累積次數(Fb) 即從低分數段向高分數段依次將對應次數進行累加。 10分以下的7人;15分以下的7+16=23人;20分以下的23+20=43人......
4)向下累積次數(Fa) 即從高分數段向低分數段依次將對應次數進行累加。 95分以上的7人;90分以上的7+16=23人;85分以上的23+53=76人......
5)向上累積相對次數(m%) 即“向上累積次數”與總人數N的百分比,也就是百分位數。 例第四行數據“95.37%”的含義是:1564名考試成績在85分以下,占全部1640名考生的95.37% 第六行的意思是85.12百分位數的考生成績在75分以下,共有1396人。
3.如何計算 1)首先以例題中取前15%的考生為例進行計算。 兩個公式都可以用,先以第一個公式進行計算。 前15%也就是找到第85(m)個百分位數,表格第五列中並沒有85%這個數, 但是我們能夠找到包含85%——第六行的“85.12%”,也就是尋找第一個大於85%的數據。 (如果我們想錄取前5%的考生,找到的對應數據就是第四行的“95.37%”。) 那麼在70分(L)和75分(U)之間我們到底要取多少分才能保證刷掉的人數正好占總人數的85%呢? 計算: a)總人數1640的85%是1394人;(m/100*N) b)70分以下的是1277人,1394-1277=117人。也就是從70~75分之間的這119人中還要刷掉117人。(m/100*N-Fb) c)這117人與該區間總人數119人的對應比重的分值=117/119*5=4.92。((m/100*N-Fb)/f*i) d)第85個百分位數對應分數=70+4.92=74.92分。(L+(m/100*N-Fb)/f*i) e)正確答案為錄取成績為74.92分。 用公式二進行檢驗: U=75,N=1640,m=85,Fa=244,f=119,i=5 P75=75-(1640*(1-85/100)-244)/119*5=74.92
2)假如我們只錄取前5%的考生,即計算出第95個百分位所對應的成績。 找到第四行數據,獲得L=80, m=95, N=1640, Fb=1486, f=78, i=5 P95=80+(95/100*1640-1486)/78*5=84.62
4.補充說明 其實我們計算出來的數值只是參考數值。如本例錄取前15%成績的246人中,244人肯定高於錄取成績74.92分,另外2人是否能達到這個成績就不好說。 這也從另一個側面說明瞭i取值大小的意義了。取值越大計算誤差越大,但是統計工作量越小;取值越小則反之。
請問:如果班上共有50個學生,而其分數是100分的有20個,99分的20個,98分的有9個,97分的有1個,那麼求第97百分位數P97=?
你這個例子比較極端,不過按照你的題目計算 P97=99.5+(97%*50-30)/20*0.5=99.96
i=np%是啥意思呀 p50所對應的數據是不是就是均值呢?
50%的是中位數,怎麼會是均值呢!他們不一定相等
到底是從大到小排列還是從小到大排列,剛開始說從大到小,舉例又是從小到大的,看著暈!