王中原唐世平：政治科学预测方法研究———以选举预测为例 - 期刊论文

学理角度理解选举贡献较少;第二，受制于技术手段局限，数据本身的代表性、测量的信度和效度、样本量等问题都将影响预测绩效;第三，无法预测投票率，意见聚合是通过样本支持率推测总体得票率，然而支持意向不等同于选票，近年来投票率下降成为明显趋势，并成为决定选举的关键因素。上述问题都可能导致严重的预测偏差，也是近年来选举民调等意见聚合方法饱受质疑的原因。

2. 模型范式。模型范式依据影响投票决定的某些关键影响因子来构建模型以预测选举结果，其中典型的模型方法包括指数模型方法(index model)、结构性因素模型方法(structuralistmodel)和选举周期模型方法(election circle model)等，虽然模型构造不尽相同，但都是依托某种变量关系和影响机制来预测选举。

第一，指数模型方法是通过收集候选人履历数据或能力评估数据来构建其潜力指数，进而预测其当选概率。该方法的预测机理是候选人资质和能力是影响投票的关键因素，其理论支撑是“选举个人化” 。一种方法是根据候选人履历来建构其资质指数(bio-index)，例如，阿姆斯特朗(Armstrong)和格雷费(Graefe)通过收集总统候选人的 59 个简历指标合成候选人的资质指数、建立指数预测模型，发现该模型可以成功预测 1896 ～2008 年 29 次美国总统选举中的 27 次，准确率甚至超过民调和博彩市场 ;另一种方法是基于对候选人在关键议题上的能力评估来构建候选人能力指数模型，据此预测选举结果，其议题通常包括经济、就业、移民、反恐、福利等。该方法预设选民会围绕选举当年的重大事项展开投票(issue voting)，历史回测表明，该方法与政治博彩市场的预测力不相上下。指数模型方法很好地“变量化”了候选人资质和能力指标，在候选人因素日趋凸显的新媒体时代更具预测力，并对候选人提名具有指导价值。

第二，结构性因素模型方法是根据影响选举的关键结构性因素来构建回归预测模型。通常被纳入模型的预测因子包括经济变量(例如 GDP 增长、失业率)和选民对在任者的政绩评估，等等。该类模型融合了政治学中的“经济投票”理论、“在任者优势”理论(incumbent advantages)、“回溯性投票”理论，其预测机理是选民会根据当下的宏观经济状况以及在任者的过往执政表现来投票。例如，一个经典的预测模型表达式为 Vote = f (Incumbent Popularity，Economic Growth)，即依据某个时点上的在任者受欢迎程度和经济增长状况两个宏观指标来预测选举。多年来，此类模型不断更新升级，发展出适用于不同国家的次模型，并被证明在总统制和在议会制下都具有一定的预测力。

第三，选举周期模型方法是根据历届选举的波动规律来预测选举，其预设同一个国家的同一种选举在时间上具有某种稳定的周期性规律，当届选举与此前选举之间不是孤立的，而是存在某种延续性。此方法对应的是“政治重组”的周期性理论，该理论认为选民的政治倾向和对政党的偏好会随着一定的时间周期移转或回归，进而带来政治的重组和轮替，这种选举“钟摆效应”在以美国和英国为代表的成熟西式民主国家表现较为明显。基于选举的时间序列特征，学者们构建出选举预测的自回归模型。例如，诺波特(Norpoth)根据美国总统大选的周期变化规律构建出二阶自回归预测模型(VOTE t = 49. 2 + 0. 525 VOTE t －1 － 0. 474 VOTE t －2 )，发现当届选举的结果可以根据上届和上上届选举的结果来预测，该模型成功预测了 2016 年美国总统大选结果。

综上，模型范式具有两大优势:第一，预测模型纳入了变量关系，依托选举理论指导，具备较强可解释性;第二，模型范式可以提前较长时间(甚至半年)得到预测结果，具有更强政策应用价值。模型范式的不足在于:第一，只注重少量宏观预测因子，忽略微观层面的选民因素，而选举研究表明投票活动除了受外在因素影响之外，选民自身的人口学特征、认同结构和社会化过程等都对其影响甚大;第二，模型范式生成的是稳态的预测结果，无法捕捉竞选活动以及突发事件引发的波动;第三，不同模型在理论视角、变量选取和测量方法上差异较大，难以检验不同模型之间的竞争性理论假设。总之，模型范式虽然优势明显，但也面临诸多挑战。

3. 混合范式。混合范式通过一定规则综合不同预测手段来优化预测效力，以期克服单一预测方法的局限。其基本预设是集合多个方法的预测结果比运用单个方法更加精准，具体可细分为一阶混合方法和二阶混合方法。

一阶混合方法通常是将“回归预测模型”与“选举民调”相结合。例如，经典的预测表达式为:

Vote = Structural Weight * ［β 1 Incumbent Approval + β 2 Economic Growth］+ Polling Weight* ［Pollst－x ］+ ε

即先依据选民对在任政府的认可度和经济增长状况两个结构性变量来构建预测模型，用以预判候选人的基准得票率，再通过实时民调捕捉选情波动，最后将两个结果通过一定的加权规则集合加总，以期得到更加精准的预测结果。该方法综合了 “模型范式”和 “意见聚合范式”的各自优势，同时弥补了民调和模型的部分弱点。研究表明，该方法在英国、德国、爱尔兰等国家的选举预测中比单个静态模型或单个民调预测都准确，虽然民调和回归模型在不同国家对预测精准度的贡献率各有不同。

二阶混合方法则更为复杂，其试图对运用各种不同方法得到的预测结果进行整体加权集合以提高预测精准度。该方法通常分两步展开: 第一步是综合同一类方法内部的不同预测数据(例如不同机构的民调结果) 得到此类方法的总体预测结果，以此削弱单一预测主体可能存在的预测偏差; 第二步再凭借一定的加权规则来集合各类不同方法的总体预测结果，得到一个大集总的预测，由此降低单一预测范式可能存在的偏差。当前，最具影响力的当属 “PollyVote”方法，其集合了来自民调、博彩市场、专家调查、群体智慧、候选人指数、经济模型等不同方法的预测数据，通过上述两步集合方法得到一个集总预测结果，回测表明该预测方法比其他单个方法都更加接近真实结果。

混合范式的优点在于: 第一，将基于结构性因素的稳态预测与来自意见聚合的动态预测相结合，在提前数月得到模型结果的同时可根据选情动态调整; 第二，综合不同类型的信息源，克服单一方法存在的局限。混合范式也面临诸多问题: 第一，存在系统性偏差的风险，特别是当被集合的多个预测源都朝同一个方向产生偏误时，预测偏差将被放大 (例如 2016 年美国总统大选); 第二，对不同预测方法的权重估计需要更加科学、透明的标准，权重设定失误可能产生新的偏误; 第三，预测源选取可能存在研究者偏见，综合并不总是最好的选择 ; 第四，综合的预测源越多，其预测结果越难从学理角度进行解释。如果预测错误，也较难回溯验证。

4. 大数据范式。大数据范式通过收集社交媒体上网民关于选举的语言和行为数据，并借助机器学习算法预测选举结果。近年来，随着移动终端和社交网络的普及，人们在虚拟空间里积累了海量的行为和交往大数据，运用计算机技术挖掘社交媒体数据以预测电影票房、产品销量、信贷风险等成为趋势，该方法也被运用于选举预测，并呈现出预测潜力。早期的大数据预测比较简单直接，通过收集社交网络 (如 Twitter、Facebook) 上针对某个政党或候选人的评论量、转发量、点赞数、粉丝数，以及热搜、维基百科浏览量等数据，来测量民众对政党/候选人的关注强度，进而推测其选举支持率。该方法被证明在某些选举中具有一定预测力，但整体预测效果欠佳且不稳定。原因在于，上述网络行为数据无法准确测量真实支持率，其中夹杂了大量 “噪音”，包括机器自动推送 (bots)、网络水军、黑公关等。此外，网络关注热度无法直接转换为选票，这受到投票资格和投票意愿的影响，且有正向和负向关注之分。为了克服这些缺陷，研究者们开始运用 “自然语言处理”技术和无监督或半监督的机器学习方法对社交数据进行情感分析 (sentiment analysis)，试图探索网络意见表达 (例如网民评论) 的语意与情感取向，并综合不同网络信息源来推算选民对政党或候选人的支持率，其改进后的预测效力有时堪比民意调查。

大数据范式的优势在于: 第一，实时快捷，能够每天甚至每小时及时更新，真正做到实时播报 (nowcast)，即刻掌握选情动态; 第二，信息源丰富，成本较低，同时可供分析和解释;第三，借助计算机处理技术，可以挖掘选民心理与投票行为的关系，捕捉线上动员的选举后果。大数据预测也面临一些挑战: 第一，网络数据通常缺乏代表性，社交网络上活跃的群体往往只是选民中的一部分 (偏年轻、都市和教育程度高的群体)，同时存在迫于政治正确较少发声的 “害羞选民”(shy voters)，代表性偏差会影响预测效力; 第二，网络语言属于自然语言，自然语言处理技术目前尚不成熟，例如政治暗语和场景化语言的语义甄别、多语种语言采集和分析难度较大，数据 “信噪比”低会影响预测质量 ; 第三，社交媒体的普及率在不同国家存在差异，在较多发展中国家无法获取足量的网络数据用于预测。此外，自从 “剑桥分析”(Cambridge Analytica) 利用脸书数据影响美国总统大选，社交媒体平台对数据获取设置了更高门槛，这些都影响

1 2 3 4

Contact Us