王中原 唐世平:政治科学预测方法研究———以选举预测为例
2020年05月31日  |  来源:政治学研究2020 年第 2 期  |  阅读量:7375
了大数据预测的发展。但是,随着算法技术的突飞猛进和数据的指数级激增,加之计算社会科学的发展,该范式前景广阔。

四、选举预测范式、方法的评估比较和发展趋势

选举预测是政治学预测性研究的前沿领域,经过八十余年的探索和积累,已经发展出丰富多元的科学预测方法,并处在不断创新升级当中。本文归纳出四类选举预测范式: 意见聚合范式; 模型范式; 混合范式; 大数据范式。每一类范式下又可细分出不同类型的预测方法,每种预测方法的技术路线、预测机理、数据基础和应用场景各有差异,同时在选举预测综合评价体系的各个维度上各显优劣 (见表 2)。

 

具体来说,混合范式在准确性上要高于意见聚合范式、模型范式和大数据范式,因为其综合了模型范式的稳态预测和意见聚合范式的动态预测,在可重复性和中立性方面也表现较好,但由于集合方式复杂而欠缺可追溯性和解释力。模型范式在超前性、解释性、可重复性、中立性和成本方面都占据优势,然而由于预测时间超前不得不牺牲一部分准确性。意见聚合范式实时更新,具备较高的准确性,但在超前性和解释力上较弱,同时调查类预测成本高昂。大数据范式结合前沿算法,具有较强的成本优势和追踪预测能力,虽然目前在机制解释、因果识别和准确性上略有不足,但有望随着技术突破和理论引导得到改进提升。总之,预测范式和方法的选择是基于不同预测目标和应用场景的综合权衡。

整体而言,现有选举预测范式存在一些共同缺陷,部分方法(例如民调)甚至遭遇发展瓶颈。首先,多数预测方法缺少选举研究理论的系统支撑,未能将“理论驱动”与“数据驱动”相结合,虽然模型范式纳入了一些有意义的预测变量,但其模型过度简约、理论依据单薄,难以检验竞争性理论假设;其次,现有预测范式缺少对选民个体层面数据的有效运用,未能纳入对选举产生关键影响的选民因素(例如性别、年龄、族群、教育、收入、宗教、职业),过度关注有限的结构性因素或候选人指标等因素,选民作为选举决策中最重要的能动主体(agent)却是缺失的;最后,未能充分将预测和解释相结合,政治学预测性研究应该致力于贯通解释和预测,在预测结果的同时探索变量之间的因果关系和影响机制,检验和优化选举理论,增进人们对选举活动的认知。

“科学预测基于对现有信息的分析,对未来尚未发生的事件进行判断,是风险较大的研究工作”。选举预测对精度的要求远超过其他形式的预测,因此风险更大。任何预测方法都可能犯错,但科学预测对错误有着不同的理解和因应方式。首先,方法运用不当导致的问题与方法本身的问题应该区分开来,误差和错误应该区分开来;其次,需要建立一套评价预测结果的客观标准,科学预测除了精确度之外,还需兼顾超前性、解释力、可重复性等;再次,失败的预测可以揭示我们知识和方法的短板,推动收集更优质的数据、优化变量选取和模型建构、反思和改进选举研究,科学的预测是一种可以被检验、被追溯、被改进的预测;最后,量化选举预测也面临不可观测因素、过度拟合(overfitting)以及样本外(out-of-example)等问题,研究者需要保持谨慎。

选举预测呈现出以下发展趋势:第一,数据来源、技术手段和预测机理不断开拓创新,老方法不断朝精细化方向改进完成自我升级,新方法旨在弥补老方法的短板和缺陷,不同预测方法相互竞争赶超,形成“百花齐放”的局面;第二,不同范式之间以及同一范式中的不同预测方法之间逐渐整合,各自发挥比较优势又相互助益;第三,选举预测越来越成为一个跨学科的研究领域,在这个领域,政治学、经济学、统计学、社会学、心理学、计算机科学甚至脑科学等不同学科交相融合,需要我们吸纳各个学科的理论和方法以及前沿的技术手段来不断推进预测研究。选举预测的若干前沿议题值得学界共同探索: 第一,“预测选举预测”,即预测不同的选举预测方法在什么时候、在哪些条件下更加准确,这属于更高阶的预测活动(high-order prediction)  ;第二,提升运用不完全信息和低信噪比数据做预测的能力,预测活动无法等到拥有高质量的数据才去做,必须探索如何高效地收集清洗数据、识别有效信息、减少噪音并将信息转化为知识和预测力;第三,加大对发展中国家选举以及各国地方选举的研究和预测。新兴民主化国家的选举往往对区域性政治动荡、投资贸易摩擦、族群宗教冲突等产生重大影响,此外,地方选举的波动性和情境性远高于国家选举,现有的各类预测方法盛行于西方成熟民主国家并聚焦国家层面,如何拓展到新型选举当中、需要做哪些调试和修正,值得学界深入探究。

五、结论

“选举预测是一项高风险的工作,但却是一项值得探索的科学事业” 。选举预测是社会科学预测性研究的关键议题,是政治学理论和方法创新的前沿领域,预测结果不仅可以满足人们预知未来的好奇心、推进政治科学研究,同时可以指导科学决策。目前科学量化的选举预测方法可划归为四大类:意见聚合范式;模型范式;混合范式;大数据范式。这些预测范式及其具体的预测方法克服了非科学预测的随意性、不可解释性、不可重复性等问题,为我们预测选举提供了丰富的工具。选举预测接下来的突破方向是将“理论驱动”与“数据驱动”相结合、微观的个体预测变量与宏观的结构性预测变量相结合、预测与解释相结合,通过跨学科合作和借助前沿技术手段推进预测范式创新,并在预测实践中不断更新升级,提升预测过程的透明度和预测结果的解释力。

在这些方面,结合选举理论和计算机技术的微观仿真模拟预测方法将是有益的尝试  。加强对选举预测以及整个政治学预测性研究的重视并非旨在替代原有的解释性研究。相反,我们认为预测和解释是“双螺旋”式的共生成长关系:解释性研究可以为预测性研究提供理论和知识基础,开启预测的议题和领域,指导预测的数据收集、变量选取和模型建构,以及解释最终预测结果;反过来,预测性研究可以检验和优化理论,发现新的研究方向,提升政治学研究的政策应用价值,等等  。两者相互助益,共同服务于增进人类对复杂政治现象和政治行为的理解。科学的预测性研究是政治学乃至整个社会科学发展相对滞后的领域,中国政治学者在相关领域涉足更少。相比西方国家(特别是美国)对预测性研究的高度重视和资金扶持,中国在相关学术领域投入严重不足。科学的预测性研究呼唤中国政治学者的参与和尝试,同时离不开学界和政府的宽容、重视和投入。作为社会科学发展的前沿领域,科学预测可以成为中国政治学探索的“富矿”。大数据、人工智能、仿真模拟等方法的兴起为预测性研究提供了新契机。选举预测的研究经验表明,解释性研究和预测性研究可以相得益彰。中国政治学学科可以在不断完善解释性研究的同时,探索预测性研究,在诸如政治风险预测研究、海外冲突预测研究、公共服务需求预测研究、公共危机预测研究等领域做出努力,运用政治学理论、知识和方法指导预测活动,通过科学预测不断丰富、完善和推进政治学研究,提升政治学的科学水平和应用价值。

(作者:王中原,复旦大学社会科学高等研究院;唐世平,复旦大学国际关系与公共事务学院.)

1 2 3 4
回到顶部