区群谬误
出自 MBA智库百科(https://wiki.mbalib.com/)
区群谬误(Ecological fallacy)
目录 |
区群谬误(Ecological fallacy),又称生态谬误,层次谬误,是一种在分析统计资料时常犯的错误。和以偏概全相反,区群谬误是一种以全概偏,如果仅基于群体的统计数据就对其下属的个体性质作出推论,就是犯上区群谬误。这谬误假设了群体中的所有个体都有群体的性质(因此塑型(Sterotypes)也可能犯上区群谬误)。区群谬误的相反情况为化约主义(Reductionism)。
Ecological fallacy这名词最先见于William S. Robinson在1950年的文章。在1930年美国人口普查结果中,Robinson分析了48个州的识字率以及新移民人口比例的关系。他发现两者之间的相关系数为0.53,即代表若一个州的新移民比率愈高,平均来说这个州的识字率便愈高。但当分析个体资料时,便发现相关系数便是-0.11,即平均来说新移民比本地人的识字率低。出现这种看似矛盾的结果,其实是因为新移民都倾向在识字率较高的州份定居。Robinson因此提出在处理群体资料,或区群资料时,必须注意到资料对个体的适用性。
这并非指任何以群体资料对个体性质作出的推论都是错误的,但在推论时必须注意群体资料会否把群体内的变异隐藏起来。
区群谬误经常出现在人口研究之中,以下是两个虚构例子:
例一:
一项研究发现甲城市民的智商平均比乙城市民高,若因此认为在两个城市各自随机抽取一个市民,甲城那位市民的智商都会比乙城的那位高,便犯上了区群谬误。因为统计结果只是对两城的平均智商作比较,乙城个别市民智商可能比甲城的个别市民高;在极端情况下,两城之中智商最高的一位市民可能生活在乙城。
例二:
假设甲城和乙城都各有相同人数的富人和穷人,富人都住在山上,而穷人都住在排放致癌物的工厂附近,故此在两个城市的穷人癌症发病率都比富人高很多倍。在甲城的都是高增值高污染工业,故此在甲城无论是富人和穷人的平均工资都比乙城高,但同时甲城穷人的癌症发病率也因此比乙城高。
一位教授希望找出癌症的风险因素,他在国家统计刊物找到甲城和乙城的癌症发病率和工资中位数,发现工资中位数较高的甲城有更高的癌症发病率,得出高收入是癌症风险因素的结论。然而事实上,贫穷才是癌症的风险因素,区群谬误带来相反的结论。