四分位數
出自 MBA智库百科(https://wiki.mbalib.com/)
四分位數(Quartile)
目錄 |
分位數根據其將數列等分的形式不同可以分為中位數,四分位數,十分位數、百分位數等等。四分位數作為分位數的一種形式,在統計中有著十分重要的意義和作用。
人們經常會將數據劃分為4個部分,每一個部分大約包含有1/4即25%的數據項。這種劃分的臨界點即為四分位數。它們定義如下:
- Q1=第1四分位數,即第25百分位數;
- Q2=第2四分位數,即第50百分位數;
- Q3=第3四分位數,即第75百分位數。
四分位數的計算[1]
(一)根據未分組的資料計算四分位數
第一步:確定四分位數的位置。
四分位數是將數列等分成四個部分的數,一個數列有三個四分位數,設下四分位數、中位數和上四分位數分別為Q1、Q2、Q3,則:Q1、Q2、Q3的位置可由下述公式確定:
Q1的位置
Q2的位置
Q3的位置
式中n表示資料的項數
第二步:根據第一步所確定的四分位數的位置,確定其相應的四分位數。
例如:某車間某月份的工人生產某產品的數量分別為13、13.5、13.8、13.9、14、14.6、14.8、15、15.2、15.4、15.7公斤,則三個四分位數的位置分別為:
Q1的位置
Q2的位置
Q3的位置
即變數數列中的第三個、第六個、第九個工人的某種產品產量分別為下四分位數、中位數和上四分位數。即:
Q1 = 13.8公斤、Q2 = 14.6公斤、Q3 = 15.2公斤
上例中(n+1)恰好為4的倍數,所以確定四分數較簡單,如果(n+1)不為4的整數倍數,按上述分式計算出來的四分位數位置就帶有小數,這時,有關的四分位數就應該是與該小數相鄰的兩個整數位置上的標誌值的平均數,權數的大小取決於兩個整數位置距離的遠近,距離越近,權數越大,距離越遠,權數越小,權數之和等於1。
例如:某車間某月份的工人生產某產品的數量分別為13、13.5、13.8、13.9、14、14.6、14.8、15、15.2、15.4公斤,則三個四分位數的位置分別為:
Q1的位置
Q2的位置
Q3的位置
即變數數列中的第2.75項、第5.5項、第8.25項工人的某種產品產量分別為下四分位數、中位數和上四分位數。即:
Q1=0.25×第二項+0.75×第三項=0.25×13.5+0.75×13.8=13.73(公斤)
Q2=0.5×第五項+0.5×第六項=0.5×14+0.5×14.6=14.3(公斤)
Q3=0.75×第八項+0.25×第九項=0.75×15+0.25×15.2=15.05(公斤)
在實際資料中,由於標誌值序列中的相鄰標誌值往往是相同的,因而不一定要通過計算才能得到有關的四分位數。
(二)由組距式數列確定四分位數
第一步,向上或向下累計次數。
第二步,根據累計次數確定四分位數的位置。
1)當採用向上累計次數的資料確定四分位數時,四分位數位置的公式是:
Q1的位置
Q2的位置
Q3的位置
式中:表示資料的總次數。
2)當採用向下累計次數的資料確定四分位數時,四分位數位置的公式是:
Q1的位置
Q2的位置
Q3的位置
式中:表示資料的總次數。
第三步,根據四分位數的位置算出各四分位數。
1)當累計次數是向上累計時,按下限公式計算各四分位數。
式中:Q1、Q2、Q3分別表示下四分位數、中位數和上四分位數;
L1、L2、L3分別表示下四分位數、中位數和上四分位數所在組的下限;
i1、i2、i3分別表示下四分位數、中位數和上四分位數所在組的組距;
表示總次數;
、、分別表示下四分位數、中位數和上四分位數所在組的次數;
SQ1 − 1表示下四分位數前一組的累計次數;
SQ2 − 1表示中位數前一組的累計次數;
SQ3 − 1表示上四分位數前一組的累計次數。
2)當累計次數是向下累計時,按上限公式計算各四分位數。
式中:Q1、Q2、Q3分別表示下四分位數、中位數和上四分位數;
U1、U2、U3分別表示下四分位數、中位數和上四分位數所在組的上限;
i1、i2、i3分別表示下四分位數、中位數和上四分位數所在組的組距;
表示總次數;
、、分別表示下四分位數、中位數和上四分位數所在組的次數;
SQ1 − 1表示下四分位數後一組的累計次數;
SQ2 − 1表示中位數後一組的累計次數;
SQ3 − 1表示上四分位數後一組的累計次數。
例如:某企業職工按月工資的分組資料如下:
按月工資分組(元) | 職工人數(人) | 向上累計職工人數 | 向下累計職工人數 |
---|---|---|---|
600以下 | 23 | 23 | 566 |
600—700 | 120 | 143 | 543 |
700—800 | 150 | 293 | 423 |
800—900 | 135 | 428 | 273 |
900—1000 | 95 | 523 | 138 |
1000以上 | 43 | 566 | 43 |
合計 | 566 | —— | —— |
根據上述資料確定某企業職工的月工資的三個四分位數如下:
1)採用向上累計職工人數的資料得月工資四分位數的位置為:
Q1的位置
Q2的位置
Q3的位置
根據計算結果可知,Q1、Q2、Q3分別位於向上累計職工人數的第二組、第三組和第 四組,月工資四分位數分別為:
(元)
(元)
(元)
2)採用向下累計職工人數的資料得月工資四分位數的位置為:
Q1的位置
Q2的位置
Q3的位置
同樣可知:Q1、Q2、Q3分別位於向下累計職工人數的第二組、第三組和第四組,月 工資四分位數分別為:
(元)
(元)
(元)
計算結果同按下限公式計算的一致,即所求某企業職工月工資的三個四分數也分別為698.75元、793.33元和897.41元。
案例一[2]
有l9名工人時產量件數為:14、15、16,16.17、18、18、19、19、20.2l,11、22、22、23、24、24、25、26,用n代表總體單位數。用Q1、Q2、Q3分別代表第一個、第二個和第三個四分位數。這三個四分位數的位置及其數值,可按下列公式算出:
Q1位置,則Q1=17件;
Q2位置,則Q2=20件;
Q3位置,則Q3=23件。
四分位數間距=Q3 − Q1=23-17=6件。四分位差==6÷2=3件。通過第一四分位數17件,可以說明有1/4的工人時產量小於17件,有3/4的工人時產量大於17件。通過第三四分位數23件,可以說明有3/4的工人時產量小於23件,有l/4的工人時產量大於23件。
如果n+1不是4的倍數,Q1、Q2、Q3的位置便是小數。可按小數比例乘以前後兩項標誌值之差求出其數值。比如有20名工人,則n=20,其四分位數為:
Q1位置,則Q1=17+(18-17)×0.25=17.25件;
Q2位置,則Q2=20+(21-20)×0.5=20.5件;
Q3位置,則Q3=23.75件。
如果根據組距數列計算四分位數,也應按從組距數列計算中位數的方法,首先確定其位置。這時Q1、Q2、Q3的位置應分別根據、、來確定。然後,再仿照求中位數的辦法,按比例推算其數值。
評論(共18條)
該四分位的演算法從一開始就是錯誤的。 中位是在(n+1)/2的位置,四分位的位置是(中位位置+1)/2。 所以(n+1)/4肯定不對! 例如n=5時,下四分位是2。 用Excel統計可以驗證結果。
中位是在(n+1)/2的位置,下四分位的位置是(中位位置+1)/2。所以(n+3)/4才對! 上四分位的位置是(中位位置+N)/2。所以(3n+1)/4才對!。用Excel統計可以驗證結果。
中位是在(n+1)/2的位置,下四分位的位置是(中位位置+1)/2。所以(n+3)/4才對! 上四分位的位置是(中位位置+N)/2。所以(3n+1)/4才對!。用Excel統計可以驗證結果。
此演算法才正確!
此演算法才正確!
Q1=1+(n-1)/4=(n+3)/4; Q3=1+3(n-1)/4=(3n+1)/4.
那個帶有小數的例子不對吧,可以用EXCEL驗證的
excel的QUARTILE函數四分位演算法是:Q1=(1n+3)/4,Q2=(2n+2)/2,Q3=(3n+1)/4,so...U C...
如果四分位數算完之後是3.12這樣的,就是小數部分比0.5小的,是進位還是捨去啊,比如3.12是第四位是四分位數還是第三位
能否舉個i不是整數的例子啊?