徐翔等:数据生产要素研究进展
2021年06月10日  |  来源:经济学动态  |  阅读量:15376

四、数据生产要素的隐私问题与交易机制

(一)数据生产要素的隐私问题

虽然企业能够利用数据生产要素创造巨大的经济利益,然而这些利益的产生往往是以侵犯消费者隐私为代价的,消费者得到的补偿却微乎其微,这也是企业与消费者间数据产权归属矛盾的主要症结所在。Kshetri (2014)指出,大数据分析技术在很大程度上都需要利用高速数据,其中比较典型的就是从移动设备中获取的点击流数据以及GPS定位数据。企业可以通过收集此类敏感数据进行精准的短期预测,但这同时也损害了消费者的隐私和安全利益。Kshetri (2014)还总结了多个国际咨询机构对于消费者如何看待大数据的调研结果,提出数据安全和隐私问题已经在全球范围内引起了广泛的担忧,消费者们越来越关注企业的数据收集方法,特别是诸如网站Cookies和GPS追踪器等追踪技术的使用。Acquisti et al (2016)从隐私的经济属性的视角,探讨了个人信息的经济价值,以及消费者在个人数据共享和隐私之间的权衡取舍等问题,认为现实经济中的个人数据既有私人价值也具有商业价值:一方面,数据共享可以减少市场摩擦,促进交易;另一方面,对数据商业价值的利用往往会导致私人效用的降低,有时甚至是整体社会福利的减少。具体例子包括,零售市场中的价格歧视、保险和信贷市场中的数量歧视、垃圾邮件以及身份盗用的风险等。

随着信息技术的快速发展,企业获取用户数据的手段和能力都在增强,消费者虽然从基于大数据分析的针对性产品推荐中获益,但也会承受个人隐私被侵犯所带来的货币成本和负效用。新的数字技术已经针对注重隐私的消费者提供了个性化的控制选项,这似乎将隐私处理的选择权交给了消费者,但大多数消费者实际上缺乏保护、管理其个人数据的意识与运用技术的成熟度。而侵犯隐私的技术服务在日常通信、求职和一般消费中已经屡见不鲜。无论是企业的商业数据还是个人数据,其所有权、访问权以及交易的法律框架仍未得到完全的确定。此外,虽然法律上的数据所有权有所缺失,但数据市场中的议价却产生了实际上的数据所有权,这往往会导致数据所有权的碎片化或反公共化。拒绝共享个人数据可能会提高消费者的隐私利益,但这种反公共化的做法会阻碍数据聚合的范围经济效应,使数据的非竞争性所能带来的经济利益无法得到充分实现,造成数据市场的失灵。

然而,使社会福利最大化的数据产权分配方式很难进行事先预测,数据经济收益与个人隐私权益间的取舍也并不能一刀切,而是应当根据具体情况进行适当安排。Tene & Polonetsky (20 12)提出了一个平衡企业及研究人员数据利益和个体隐私权益的模型设想,要求政策制定者首先确定需要征得用户同意方可使用的“个人可识别”的数据类型范围,并将这些个人可识别的数据置于法规监管框架中;在此基础上,兼顾隐私数据保护原则与其他诸如公共卫生、国家安全和环境保护等社会价值的平衡,当预期数据使用的收益明显大于隐私风险时,即使个体拒绝同意,也仍然认定数据的使用是合法的。

Jones & Tonetti (2020)建立了一个数据经济的理论框架,专门研究数据产权的不同分配方式对消费者福利的影响。他们的基本判断是,当企业拥有数据的产权时,就不会充分尊重消费者的隐私。此时政府可能出于对隐私权的关注而大幅限制企业对消费者数据的使用,然而,这在产生隐私收益的同时却也使非竞争性的数据生产要素不能以最优的规模投入使用,继而导致无效率的情况出现。倘若不存在政府的该类限制,从理论上讲,非竞争性就能使数据在企业间广泛使用,从而产生巨大的社会经济收益,但如果出售数据会加快“创造性毁灭”的速度,企业就会有囤积数据并阻止其他企业使用的动机,这同样会造成无效率的均衡结果。基于上述分析,Jones & Tonetti (2020)提出,消费者数据所有权产生的消费和福利远高于企业数据所有权,将数据产权赋予消费者可以带来接近最优的分配。如果这一判断是准确的,数据的市场机制就不符合科斯定理。

如果按照Jones & Tonetti (2020)的建议,将数据所有权赋予消费者,是否就能够实现对于数据价值的充分保护与合理分配?一些实验研究表明,消费者可能会轻易地将自己和亲友的数据交给企业,有时仅仅是为了换取非常低的回报。Athey et al (2017)将这种表现出关注数据隐私的态度但却在现实中轻易披露数据和信息的消费者行为定义为“数字隐私悖论”,并通过两个实验验证了数字隐私悖论确实存在,并且研究发现,无论是受试者的个人特征(如性别、年龄等),还是受试者所表达出的关于隐私的偏好,对于其在数据隐私披露上做出的实际选择都影响甚微。Liu et al (2020)的研究也给出了类似的结论。他们首先在支付宝中添加一个第三方小程序,然后通过一项调查获得用户对于数字隐私的偏好,最后再让用户选择是否使用这一必须提供个人数据才能运行的小程序。实验结果显示,那些声称非常在意数据隐私的用户实际上大多都与第三方小程序共享个人数据。随着授权的数据越来越多,用户对数据隐私的担忧也在逐步增加,但是这种担忧仅仅止步于“担忧”,并没有改变其将个人数据共享给第三方平台的行为。

(二)数据生产要素的交易机制

针对数据生产要素的隐私与权益问题,一些学者试图通过设计数据生产要素的交易机制来提升社会的总福利水平。Elvy (2017)探讨了两种极端化的数据交易模式对于经济福利的影响。第一种名为“为隐私付费”的模式将数据初始产权交给了企业,要求消费者在购买产品或服务时支付一笔额外的费用来保证其数据不被收集和挖掘并用作广告用途。第二种名为“私人数据经济”的模式将数据产权放还消费者,在该模式中,类似于Datacoup这样的数据收集企业需要直接向个人购买数据。两种模式都促进了隐私数据向可交易产品的转化,但同时也可能产生或加剧隐私数据获取的不平等,并进一步导致掠夺或歧视性行为的发生。

如果将数据产权直接赋予企业或消费者均不能实现最好的福利结果,那么能否通过引入数据中介来改善数据生产要素的配置?Bergemann & Bonatti (2019)详细分析了以数据公司形式存在的数据中介在信息市场中的作用及其与经济福利的关系。数据中介从个人消费者处收集信息并销售给企业,而企业利用这些信息来改进价格和数量决策。单个企业可以利用得到的数据划分市场,并进行三级价格歧视,从而获得超额利润。在这种情况下,商品价格与消费者支付意愿的相关性越大,企业获得的利润就越大,而消费者剩余和社会总福利则会越低。虽然传统理论表明三级价格歧视所造成的社会福利降低会使数据中介无利可图,但Bergemann & Bonatti (2019)指出,如果给定消费者需求不确定性和消费者数据信息含量的范围,以及假设数据中介聚合了单个消费者的信号并根据总需求的后验估计将信息传递给企业,那么市场中总会存在一个临界值n-,使得当且仅当消费者的数量N满足N>n-时,数据中介能够进入市场并获取正的利润,并对消费者福利造成损害。

既然如此,数据中介对于消费者福利的负面影响能够通过竞争化解吗?Ichihashi (2020)给出了否定的答案。在其数据市场模型中,包含一名消费者、多个竞争性的数据中介以及一家下游企业。在该模型中,购买数据的下游企业会通过价格歧视和骚扰广告侵吞消费者权益,因此中介可能会对收集消费者数据的行为进行补偿。这种补偿既可能是货币转移,也可能是诸如免费的在线网络地图服务等非货币的回报。由于数据生产要素具有非竞争性,如果多个中介机构都提供较高的补偿,那么消费者就会与所有中介机构共享同一套数据,并接受所有平台的货币和服务补偿,这无疑降低了数据的下游价格,损害了数据中介的收益。而中介平台也预测到了这一问题,因此最终所有中介都不会有提供高补偿的动机。因此,消费者从数字市场的竞争性中得到的福利要少于传统的商品市场。最后,Ichihashi (2020)还指出,在中介收集的数据集互斥且需向消费者提供补偿的条件下,数据集中度越高、越接近数据垄断的均衡,中介机构的利润就越高,而消费者的福利越低。

五、小结与研究展望

截至目前,对于数据生产要素的研究已经取得了一些关键性的重要突破。对于数据生产要素影响企业表现的微观机制,以及数据生产要素影响经济增长的路径,均形成了一系列具有重要意义的理论与实证成果。当然,由于这一研究领域仍处于发展早期,尚存以下几点比较明显的不足之处有待改进:

第一,在数据生产要素驱动经济增长的研究中,对于溢出效应的讨论相对不足。与大数据相关的ICT技术和数据分析技术均表现出一定的通用目的技术特征,能够作为经济社会活动的基础性技术间接推动生产效率的提升。数据生产要素本身具有的非竞争性也导致其具有较强的正外部性,如被广泛使用的政府公开数据显著提升了企业的决策效率。然而,在目前研究数据生产要素对经济增长影响的文献中,大多缺少对于上述两种溢出效应的理论建模,这就可能导致数据生产要素对于总产出的综合影响被低估。因此,数据生产要素的宏观研究也应更加深入地探讨数据生产要素的溢出效应。

第二,无论是基于微观数据还是宏观数据,数据生产要素相关的实证文献较之理论文献仍相对薄弱。这主要是因为目前对于数据生产要素的测度与估计仍缺少共识性方法,相关数据要么不可得,要么不可比,从而导致对于数据生产要素的实证研究相对分散、割裂,缺少一致性和系统性。绝大多数实证研究都以自行调研、收集的企业数据为基础,其采用的研究方法与分析方法也各不相同,导致相关实证研究的体系性较差,也不利于数据生产要素基础理论的提炼与升华。

第三,对于数据生产要素的跨国分析严重不足。想要准确把握数据生产要素对于经济增长与经济发展的综合影响,就需要以国家层面的宏观测度与对应的生产率估计为基础。目前除加拿大统计局等少数统计机构之外,无论是各国的统计机构还是研究机构,均没有对数据生产要素的测度与估计予以足够重视。虽然一些国际组织如IMF和OECD发布了一些相关的研究报告,但是这些研究均尚未落实到指标测算与跨国分析的层面,这就限制了相关宏观研究的进一步发展和深化。

第四,对于数据生产要素如何影响社会福利的探讨仍不够深入。数据作为一种生产要素,在进入生产活动后自然会产生要素收入的分配问题。虽然现有研究已经开始关注数据相关的产权和分配问题,然而大多数讨论是在理论层面上进行的,缺少有说服力的经济证据。此外,绝大多数相关文献建议将数据产权转交给消费者,这虽然在理论上能获得最高的消费者福利,但在实际推进的过程中却面临极大的现实困难。因此,为了防止数据生产要素的发展导致收入不平等进一步恶化,需要对于数据生产要素的福利经济学含义进行更加深入的探讨,通过更好的市场机制设计与政策手段,实现收入的均等化与社会福利的最大化。

有理由相信,随着数字经济的进一步发展以及数据生产要素核心地位的进一步确立,相关研究也将向纵深发展。中国的数字经济发展在全球占据优势地位,中国也是最早在官方规划性文件中将数据纳入生产要素范畴的国家之一。在ICT基础设施和大数据产业的相关投入规模方面,中国也均居全球前列。此外,中国还是全世界生产数据最多的国家之一。据国际数据公司(IDC)统计,中国14亿多人口创造的数据超过整个世界数据量的20%。我们坚信,数据生产要素将在中国下一阶段的经济发展中发挥举足轻重的作用,基于中国视角的相关理论和实证研究也会如雨后春笋般涌现,值得经济学界予以加倍重视。

(注和参考文献略)

(徐翔、田晓轩,中央财经大学经济学院;厉克奥博,清华大学中国经济思想与实践研究院。原载《经济学动态》2021年第4期。)


1 2 3 4
回到顶部