60.“所有男人都喜欢看世界杯吗”|区群谬误
某女孩问一位男同事:“咦,你今天还在加班,不回去看比赛吗?”
男同事说:“看什么比赛?”
女孩很诧异,说:“世界杯啊!男同胞们不是都很喜欢足球吗?”
男同事摇摇头,说:“我对足球一点兴趣都没有,也不了解。”
上述事件中的女孩认为,所有男人都会喜欢足球,并热衷于看世界杯。但她没想到,自己身边的这位男同事是特例,压根就不看足球。在这件事情上,女孩犯了一个严重的逻辑错误,那就是“区群谬误”。
听起来有点晦涩难懂,其实它是一种在分析统计资料时经常会犯的逻辑错误,指的是仅仅基于群体的统计数据就对其下属的个体性质做出推论。区群谬误假设了群体中的所有个体都具有群体的性质,是典型的以全概偏。
区群谬误,最早出现在美国社会学家威廉·罗宾逊在1950年发表的文章中。
1930年,美国进行了一次大规模的人口普查,罗宾逊针对这次普查结果,分析了48州的识字率及新移民人口比例的关系。结果发现,两者之间的相关系数是0.53,也就是一个州的新移民人口比率越高,平均来说这个州的识字率就越高。然而,当罗宾逊在分析个体资料时,却发现了不一样的情况:移民比率与识字比率之间的相关系数是-0.11,即平均来说新移民比本地人的识字率低。
为什么会出现这种看起来矛盾的结果呢?罗宾逊通过调查研究,终于搞清楚了原因:原来,新移民普遍倾向于在识字率较高的州定居。由此,罗宾逊提出:在处理群体资料或区群资料时,必须注意到资料对个体的适用性。
这里需要说明的是,罗宾逊并不是指任何群体资料对个体性质做出的判断都是错误的,而是说用群体资料推断个体资料时,必须注意群体资料是否会把个体的特殊性隐藏起来。比如,你认识了一个某个地区的人,他可能有懒惰、小心眼的毛病,但你不能以此为论据,推出某个地区的人都有这种特点。
要避免区群谬误,应当在整体认识某一群体的基础上,用具体的眼光去看待群体中的个体。尽管群体的特性可能适用于个体,但未经调查,不能盲目地把群体的特性挪到个体上。毕竟,个体可能与具有群体相一致的特性,也可能有和群体截然不同的特性。