四分位差

用手机看条目

出自 MBA智库百科(https://wiki.mbalib.com/)

四分位差(Quartile Deviation)

目录

什么是四分位差[1]

  四分位差又称内距、也称四分间距(inter-quartile range),是指将各个变量值按大小顺序排列,然后将此数列分成四等份,所得第三个四分位上的值与第一个四分位上的值的差。

四分位差的公式[1]

  四分位差用公式表示:

  Q = Q3Q1

  其中:Q1的位置=(n+1)/4

  Q3的位置=3(n+1)/4

  四分位差若图所示:

四分位差

四分位差的特点[2]

  四分位差反映了中间50%数据的离散程度。其数值越小,说明中间的数据越集中;数值越大,说明中间的数据越分散。与极差(最大值与最小值之差)相比,四分位差不受极值的影响。此外,由于中位数处于数据的中间位置,因此四分位差的大小在一定程度上也说明了中位数对一组数据的代表程度。

四分位差的适用范围[2]

  四分位差主要用于测度顺序数据的离散程度。当然,对于数值型数据也可以计算四分位差,但不适合于分类数据。

四分位差的计算

四分位差的计算方法[3]

  如果所给的数据资料不同,四分位差的具体计算方法也不同:

  1.未分组数据

  首先对数据进行排序,求出QlQ3所在的位置;其次根据位置确定其对应的标志值即QlQ3;最后计算二者差额的一半,即\frac{Q_l-Q_3}{2}就是四分位差。

  Ql的位置=\frac{n+1}{4}

  Q3的位置=\frac{3(n+1)}{4}

  2.单项式数列

  先计算各组的累计次数,然后确定分位点位置。

  Ql的位置=\frac{\Sigma{f}}{4}

  Q3的位置=\frac{{3}\Sigma{f}}{4}

  对于上面的两种情况,若(n+1)或Σf恰好为4的倍数,则计算出来的四分位数的位置就是整数,这时,各个位置上的变量值就是相应的四分位数;若(n+1)或Σf不是4的倍数,则按上面公式计算出来的四分位数的位次就可能带有小数,这时可根据插值法来计算上下四分位数。再按公式计算出四分位差。

  假设样本容量为50时,\frac{n+1}{4}=12.75,\frac{3(n+1)}{4}=38.25,则按插值法可得:

  \frac{X_{13}-Q_1}{X_{13}-X_{12}}=\frac{13-12.75}{13-12}

  整理得:Q1=0.25X12+0.75X13

  同样可得:Q3=0.75X38+0.25X39

  3.组距式数列

  先计算上、下四分位的值,然后再计算四分位差。此时计算四分位数的基本原理与中位数相类似。计算公式如下:

  Q_1=L_{Q_1}+\frac{\frac{\Sigma{f}}{4}-S_{Q_1-1}}{f_{Q_1}}×d_{Q_1}

  Q_3=L_{Q_3}+\frac{\frac{{3}\Sigma{f}}{4}-S_{Q_3-1}}{f_{Q_3}}×d_{Q_3}

  式中,L_{Q_1}L_{Q_3},分别代表下四分位和上四分位数所在组的下限;S_{{Q_1}-1}S_{{Q_3}-1}分别代表下四分位和上四分位数所在组以下的累计次数;f_{Q_1}f_{Q_3}分别代表下四分位和上四分位数所在组的次数

四分位差的计算案例[4]

  例1:由7人组成的旅游小团队年龄分别为:17、19、22、24、25、28、34,求其年龄的四分位差。计算步骤为:

  ①计算Q1,与Q3的位置。

  Q1的位置=\frac{n+1}{4}=\frac{7+1}{4}=2

  Q3的位置=\frac{3(n+1)}{4}=\frac{3 \times (7+1)}{4}=6

  即Q1Q3的位置分别为第2位和第6位。

  ②确定Q1Q3的数值。

  Q1=19(岁)

  Q3=28(岁)

  即第2位和第6位对应年龄分别为19岁和28岁。

  ③计算四分位差。

  Q.D.=Q3Q1=28-19=9(岁)

  ④含义。说明该旅游小团队有50%的人年龄集中在19~28岁之间,最大差异为9岁。

  例2:由8人组成的旅游小团队年龄分别为:17、19、22、24、25、28、34、38,求其年龄的四分位差。计算步骤为:

  ①计算Q1Q3的位置。

  Q1的位置=\frac{n+1}{4}=\frac{8+1}{4}=2.25

  Q3的位置=\frac{3(n+1)}{4}=\frac{3 \times (8+1)}{4}=6.75

  即Q1Q3的位置分别为第2.25位和第6.75位。

  ②确定Q1Q3的数值。由于Q1Q3的位置带有小数,所以Q1Q3的数值要按照小数点后数值的比例在相临的两个数值之间进行分摊。即:

  Ql=0.75x2+0.25x3=0.75×19+0.25×22=19.75(岁)

  Q3=O.25x6+O.75x7=0.25×28+0.75×34=32.5(岁)

  ③计算四分位差。

  Q.D.=Q3-Q1=32.5—19.75=12.75(岁)

  ④含义。说明该旅游小团队有50%的人年龄集中在19.75岁至32.5岁之间,最大差异为12.75岁。

  (2)分组资料计算的四分位差。

  例3:根据某车间工人日产量分组资料,如表1所示,计算四分位差。

某车间工人日产量分组资料
按日产量分组(个)工人数f(人)向上累计工人数F(人)
5~101212
10~154658
15~203694
20~256100
合计100——

  计算步骤为:

  ①确定Q1Q3的位置。

  Q1的位置=\frac{\Sigma{f}}{4}=\frac{100}{4}=25

  根据向上累计工人数可知Q1在第2组即10~15内。

  Q3的位置=\frac{{3}\Sigma{f}}{4}=\frac{3 \times 100}{4}=75

  根据向上累计工人数可知,Q3在第3组即15~20内。

  ②计算Q1Q3的数值。

  Q_1=10+\frac{\frac{100}{4}-12}{46} \times (15-10)=11.4(个)

  Q_3=15+\frac{\frac{3 \times 100}{4}-58}{36} \times (20-15)=17.4(个)

  ③计算四分位差。

  Q.D.=Q3-Ql=17.4-11.4=6(个)

  ④含义。计算结果表明,有50%(一半)工人的日产量分布在11.4~17.4之间,且最大差异为6个。

  四分位差的优点表现为不受两端各25%数值的影响,能对开口组数列的差异程度进行测度,可以衡量中位数代表性高低。缺点为不能反映所有标志值的差异程度。

参考文献

  1. 1.0 1.1 第九部分 资料的统计分析.安徽理工大学,2007年10月8日
  2. 2.0 2.1 贾俊平编著.描述统计[M].ISBN:7-300-04576-6/C8.中国人民大学出版社,2003
  3. 李国柱主编.统计学.科学出版社,2004.8.
  4. 王琪延,张卫红主编.统计学.中国市场出版社,2010.10.
本条目对我有帮助57
MBA智库APP

扫一扫,下载MBA智库APP

分享到:
  如果您认为本条目还有待完善,需要补充新内容或修改错误内容,请编辑条目

本条目由以下用户参与贡献

Yixi,Dan,jane409,方小莉,Teatall.

评论(共8条)

提示:评论内容为网友针对条目"四分位差"展开的讨论,与本站观点立场无关。
183.16.108.* 在 2013年4月8日 09:25 发表

公式上写Q1的位置是n+1/4,Q3的位置是3(n+1)/4。为什么举例里面就都不加1了呢? 不懂。

回复评论
jane409 (Talk | 贡献) 在 2013年4月8日 14:30 发表

183.16.108.* 在 2013年4月8日 09:25 发表

公式上写Q1的位置是n+1/4,Q3的位置是3(n+1)/4。为什么举例里面就都不加1了呢? 不懂。

谢谢您的指正,我们已做了修改,望对您有帮助~

回复评论
163.13.16.* 在 2013年11月6日 20:55 发表

Q3-Q1到底是四分位距還是四分位差?? 在我印象中Q3-Q1=IQR=四分位距

而四分位差是(Q1+Q3)/2

回复评论
153.3.61.* 在 2016年12月21日 21:43 发表

不用除以2 // 其次根据位置确定其对应的标志值即Ql、Q3;最后计算二者差额的一半,即就是四分位差。

回复评论
117.136.24.* 在 2017年1月5日 19:58 发表

到底要不要除以2,感觉一下除以2,一下又不除以2,在1.未分组数据中除以2后面又没有除以2

回复评论
59.126.155.* 在 2018年1月12日 20:05 发表

毫無幫助看不懂

回复评论
140.115.202.* 在 2019年11月6日 01:32 发表

QD跟IQD是不一樣的東西吧......

回复评论
Llyn (Talk | 贡献) 在 2019年11月6日 11:03 发表

140.115.202.* 在 2019年11月6日 01:32 发表

QD跟IQD是不一樣的東西吧......

你说的是IQR吗?

回复评论

发表评论请文明上网,理性发言并遵守有关规定。

打开APP

以上内容根据网友推荐自动排序生成

闽公网安备 35020302032707号