全球专业中文经管百科,由121,994位网友共同编写而成,共计435,753个条目

虚拟变量陷阱

用手机看条目

出自 MBA智库百科(https://wiki.mbalib.com/)

虚拟变量陷阱(Dummy Variable Regression)

目录

什么是虚拟变量陷阱

  虚拟变量陷阱是指一般在引入虚拟变量时要求如果有m个定性变量,在模型中引入m-1个虚拟变量。否则,如果引入m个虚拟变量,就会导致模型解释变量间出现完全共线性的情况。我们一般称由于引入虚拟变量个数与定性因素个数相同出现的模型无法估计的问题,称为"虚拟变量陷阱"

虚拟变量陷阱的内容

  自变量中包含了过多的虚拟变量造成的错误;当模型中既有整体截距又对每一组都设有一个虚拟变量时,该陷阱就产生了。或者说,由于引入虚拟变量带来的完全共线性现象就是虚拟变量陷阱。

  比如“性别”含男性和女性两个类别,所以当性别作为解释变量时,应向模型引入一个虚拟变量。取值方式是:D=1(男性)、D=0(女性)或D=0(男性)、D=1(女性)而当“学历”含有四个类别时,即大学、中学、小学、无学历。当“学历”作为解释变量时,应向模型引入三个虚拟变量。一种取值方式是:1(大学)1(中学)1(小学)D1=0(非大学)D2=0(非中学)D3=0(非小学)所谓的“虚拟变量陷阱”就是当一个定性变量含有m个类别时,模型引入m个虚拟变量,造成了虚拟变量之间产生完全多重共线性,无法估计回归参数。在m-1个虚拟变量中,虚拟变量可以同时取值为0,但不能全部取值为1。

  当定性变量含有m个类别时,不能把虚拟变量的值设为D=0(第一类)D=1(二类)D=2(三类)等等。

  若对两个相互排斥的属性 “居民属性”,仍然 引入个虚拟变量,则有则模型为对任一家庭都有:即产生完全共线,陷入了“虚拟变量陷阱”。“虚拟变量陷阱”的实质是:完全多重共线性。

相关条目

本条目对我有帮助54
MBA智库APP

扫一扫,下载MBA智库APP

分享到:
  如果您认为本条目还有待完善,需要补充新内容或修改错误内容,请编辑条目投诉举报

本条目由以下用户参与贡献

寒曦.

评论(共6条)

提示:评论内容为网友针对条目"虚拟变量陷阱"展开的讨论,与本站观点立场无关。
114.255.40.* 在 2017年4月18日 15:47 发表

等于没说,为什么共线这才是关键

回复评论
59.57.217.* 在 2017年4月25日 15:34 发表

也想知道,望有大神路过来说说

回复评论
111.202.154.* 在 2017年11月15日 14:33 发表

114.255.40.* 在 2017年4月18日 15:47 发表

等于没说,为什么共线这才是关键

以上面學歷來說,如果用ABCD分成四類來表示,當其中三項確定時,第四項就確定了。舉例來說,不是大學中學小學,所以ABC都是0,這樣不就可以確定D是1了嗎?可以想成這樣彼此間就不是線性獨立,在做回歸預測時這種係數的矩陣不存在反矩陣,當然就無法計算囉

回复评论
182.138.127.* 在 2018年4月8日 10:51 发表

59.57.217.* 在 2017年4月25日 15:34 发表

也想知道,望有大神路过来说说

一共只有M个选择,1=A+B+……+M,那么M=1-A-B-……M-1。M能够被其他M-1个变量所表示,这还不是共线?

回复评论
192.168.1.* 在 2018年9月26日 09:34 发表

等于没说

回复评论
109.175.208.* 在 2019年11月29日 23:45 发表

共线性是指,在一个线性回归方程中,所有的自变量不能有线性关系,如果有线性关系,这个方程则是无效的

回复评论

发表评论请文明上网,理性发言并遵守有关规定。

打开APP

以上内容根据网友推荐自动排序生成

下载APP

闽公网安备 35020302032707号