编者按:本文从“隐藏选民”理论出发,利用客观数据分析2016年美国大选民调机构失准的原因,并根据“隐藏选民”假说的内在逻辑对其进行检验。文章从多个方面分析认为“隐藏选民”假说不足以解释2016年大选的民调偏误,同时根据2016年选民的变化及特征分析偏误原因,并提出了民调机构的改进设想。文章对“隐藏选民”假说的阐述和检验值得关注,故推荐。
2016年美国总统大选民调预测的严重失准使得民调行业遭遇空前的信任危机,民调机构大多将对唐纳德·特朗普支持率的低估归因于“隐藏选民”。“隐藏选民”假说的核心机理在于,民意调查中受访者为了避免被贴上负面的社会标签或出于政治正确,选择按照社会期望来回答问题。“隐藏选民”假说常被用于解释民调的错判,然而目前对于该假说缺乏科学系统的验证。文章从五个维度对2016年美国大选中的“隐藏选民”问题进行检验,验证结果显示“隐藏选民”假说并不足以解释本次选举的民调偏误。研究发现两党初选对支持者结构的重塑是造成民调失准的重要原因,传统民调预测方法在关键群体的投票率、提前投票的风向研判等方面都有待改进。此外,探索除民调之外多样化的选举预测方法也是学界应努力的方向。
一、引言
民意调查是应用最广泛的选举预测方法。然而,在 2016 年美国大选中,几乎所有主流民调机构的选前预测与大选结果都相差甚远。选前多数民调机构判定希拉里将胜选,YouGov的预测显示希拉里将以317张选举人票赢得选举,路透社、赫芬顿邮报、CNN和纽约时报分别预测希拉里有90%、98%、91%和85%的胜选几率,因成功预测2012年美国大选而名声大噪的聚合民调预测机构“Fivethirtyeight”也认为希拉里有71%几率胜选。然而,最终选举结果却是特朗普赢得了306张选举人票,当选总统。有人认为希拉里赢得多数普选票依旧表明民调机构并没有丧失捕捉选民偏好的能力。在全国层面,选前一周的平均民调显示希拉里有3. 3%的领先优势,这与其最终2.1%的普选票优势相差不大。但在州层级的民调上,尤其是对选举结果具有决定性影响的关键摇摆州,民调误差却非常惊人,同时民调对“锈带选民”、少数族裔选民、白人女性选民的偏好捕捉严重失准进一步加剧了误差问题(Gelman etal. ,2016)。在本次美国大选中,多数民调机构预测失准对以民调为基础的选举预测范式提出了巨大挑战,如何解释民调失准成为选后热议的话题。
二、民调误差的机制解释与“隐藏选民”假说
(一)民调误差的机制解释
对于民调偏差存在诸多假说和机制解释,较为流行的包括“未决定选民”假说(late decider) 、“无反应偏差”假说(non- response bias)和“隐藏选民”假说(shy voter)。“未决定选民”假说认为民调出现大幅误差是因为在选举中存在大量在投票最后时刻才做出决定的选民,这使得选前民调无法有效捕捉选民的完整偏好。“美国民意研究协会”(American Association for Public Opinion Research) 的研究报告指出:在竞选最后一周左右的时间里,选民对特朗普的偏好发生了较大变化,特别是在特朗普以微弱优势获胜的州(Kennedy et al. ,2018)。该报告认为,大量中西部州的选民在选前最后一刻才做出决定,这使得依靠2016年10月中旬民调的各项预测出错。诚然,选民较晚做出决定对民调波动会产生一定影响,但是该研究并没有提供关键性的证据说明未决定选民的规模及其分布对民调误差的影响程度到底如何。相反,埃里克森和沃勒齐恩(Wlezien & Erikson,2002)对历届选举的研究则表明:选举前3~4周的民调已经能够比较全面地反映出最终的投票趋势。希拉尼迈尔等人(Shirani - Mehr et al. ,2018)的研究也表明:民调的误差在选前的最后几周趋向稳定,选前一个月与选前一周的均方差几乎没有差异。因此“未决定选民”假说并不能为民调失准提供充分的解释。
民调偏误生成的另一个替代性解释是“无反应偏差”,即受访者较高的“不回应率”是造成民调失准的关键原因。相关研究指出低教育水平群体(Chang & Krosnick,2009)以及有反联邦政府倾向的选民群体(U.S.Census Bureau,2015)更不愿回答选举的相关问题。但是,皮尤中心在2016年及其此前展开的各项研究均表明民调误差与不回应率之间并不存在显著的正相关关系(Keeter,2017),“无反应偏差”假说也不足以解释2016年大选中普遍的民调失准现象。
基于此,研究者们将目光转向第三种解释机制——“隐藏选民”,即认为选民在特定情景和因素的作用下,选择向民调机构隐藏自身的真实偏好,从而造成民调偏差。2016年大选后,包括盖洛普和皮尤中心在内的多家权威研究机构运用选后回访或实验调查等方法检测出存在一定数量的“隐藏选民”,相关研究指出特朗普的高度争议性使得其支持者不愿意向民调机构透露自身的真实偏好,致使民调机构无法精准地捕捉选民的真实投票意愿,进而造成民调系统性地低估了特朗普的实际支持率,导致预测失败(Switze,2016)。
总体来说,“隐藏选民”假说似乎为民调预测失败提供了合乎逻辑的解释,并获得一些证据支持,因此目前被媒体和民众广为接受。然而,该假说目前尚缺少科学系统的验证,对相关数据的系统比对和交叉检验相当缺乏。因此,本文将从“隐藏选民”的理论基础和逻辑预设出发,利用客观数据对其进行多维度检验。
(二)“隐藏选民”假说的缘起及其争论
将民调失准归咎于“隐藏选民”已成为民调行业的惯例。“隐藏选民”假说的提出源于英国大选中经常出现的民调偏误现象,尤其是在1992年,梅杰领导的保守党在选前民调中一直表现欠佳,但在最终选举中异军突起赢得大选。鉴于此以及第二次世界大战以来多次出现的选举民调机构低估保守党得票率的现象(Loosemore & Hanby,1971),研究者提出了“隐藏的托利党选民”假说(Shy Tories,直译为“害羞的托利党人”),认为保守党选民有隐藏自身偏好的倾向,在接受访问时不愿透露其真实投票意向,进而导致民调低估保守党的支持率(Elgot,2015)。