徐翔等:数据生产要素研究进展
2021年06月10日  |  来源:经济学动态  |  阅读量:15371

摘要:在数字经济时代,数据被广泛地视为一种新的生产要素,在社会生产活动中发挥着越来越重要的作用。本文首先探讨了数据生产要素的经济学概念及其主要特征,强调了数据生产要素的虚拟性和非竞争性特征,以及由此产生的边际产出递增、强正外部性、产权模糊与衍生性等特点。进一步,本文梳理了数据生产要素价值的估计方法以及将数据生产要素纳入经济增长框架的宏观经济理论。之后,本文相继分析了数据生产要素对微观企业决策与生产效率的影响,与数据要素相关的产业组织问题,以及金融市场中数据所发挥的降低信息摩擦的作用。最后,本文介绍了数据生产要素相关的隐私问题及其可能的交易机制,提出了当前数据生产要素相关研究存在的一些主要不足与未来拓展研究的方向。

关键词:数据生产要素  数据价值  经济增长  企业决策  市场机制


进入21世纪以后,数据对个人行为、企业决策、产业升级以及经济增长的影响与日俱增。《经济学人》2017年5月的封面文章大胆预言:“数据是新的‘石油’,也是当今世界最宝贵、同时也是最需要加强监管的资源。”现如今,数据已经出现在经济社会的各个角落,大量的数据被生成、记录与整理。大数据技术和人工智能技术的发展使得对于数据的使用贯穿于整个社会生产过程之中。强调数据所发挥作用的数字经济(digital economy)已经逐渐形成。2017年12月8日,习近平总书记在主持中共中央政治局就实施国家大数据战略进行的第二次集体学习时指出:“要构建以数据为关键要素的数字经济。建设现代化经济体系离不开大数据发展和应用”。数据的生产要素地位得到进一步明确。

2010年后,各主要经济体开始将数据相关技术与产业的发展问题上升到国家战略层面。一国拥有的数据规模与数据分析处理能力,已经成为其国家竞争力的重要组成部分。2012年3月29日,美国政府宣布投资2亿美元启动“大数据研究和发展计划”,以应对大数据革命带来的机遇,推进相关研究机构进一步进行科学发现、创新研究和商业转化。2019年12月,美国政府发布《联邦数据战略与2020年行动计划》,明确将数据作为一种战略性资源进行开发。2020年2月19日,欧盟委员会公布了一系列围绕数据资源的发展规划,包括《欧洲数据战略白皮书》《人工智能白皮书》等多份文件,详细概述了欧盟未来五年实现数据经济所需的政策措施和投资策略,以及构建一个真正的欧洲数据统一市场的发展目标。

在我国,随着近年来数字经济的高速发展,尤其是社会生产过程的广泛网络化、数字化与智能化,数据作为一种生产要素所发挥的作用在社会经济中也已经充分凸显。2019年10月31日,中国共产党第十九届中央委员会第四次全体会议通过《中共中央关于坚持和完善中国特色社会主义制度推进国家治理体系和治理能力现代化若干重大问题的决定》。文件中提出,“健全劳动、资本、土地、知识、技术、管理、数据等生产要素由市场评价贡献、按贡献决定报酬的机制”。2020年3月30日,中共中央、国务院发布《关于构建更加完善的要素市场化配置体制机制的意见》,明确提出要加快培育数据要素市场,为进一步发挥数据生产要素的作用指明了方向。上述政府文件与发展规划均充分表明,数据生产要素已成为中国经济在高质量发展时期的重点。

事实上,对于数据经济的探索已经成为近年来经济学研究的热点与前沿。美国社会科学联合会(ASSA)在其2020年年会上专门举办了“大数据,国民账户和公共政策”子论坛,数十位学者深入讨论了数据在宏观经济层面的核算和应用等问题。在2021年1月的美国经济学联合会(AEA)年会上,数十场分论坛以大数据技术在经济中的使用等相关话题为讨论主题。从经济学的整体发展趋势上看,数据生产要素的研究热点已经逐步形成,一批重要的理论与实证文献正如雨后春笋般不断出现。

一、数据生产要素的概念与主要特征

(一)数据生产要素的概念

在最新版的《牛津英语词典》中,数据 (da ta)被定义为“被用于形成决策或者发现新知的事实或信息”。根据国际标准化组织(ISO)的定义,数据是对事实、概念或指令的一种特殊表达方式,用数据形式表现的信息能够更好地被用于交流、解释或处理。在《现代汉语词典》(第七版)中,对于数据的解释是:“进行各种统计、计算、科学研究或技术设计等所依赖的数值”。从经济活动的角度,加拿大统计局(2018)将数据定义为“已经转化成数字形式的对于现实世界的观察”。采取数字形式的数据能够被储存、传输以及加工处理,数据的持有者也能够从中提取新的知识与信息。Farboodi & Veldkamp (2020a)将数据理解为“可以被编码为一系列0和1组成的二进制序列的信息”。按照这一定义的数据既包括数字化的音乐、影像资料和专利等,也包括统计数据和交易记录。前者可以被看作是以数据形式存在的产品与服务,而后者则更多地被看作是为了生产知识而进行的投入。从上述定义中可以看出,数据的概念与信息密切相关,数据在很多时候被视为信息的一种表现形式或者数字化载体。

Jones & Tonetti (2020)研究了数据进入生产过程的基本模式,进而定义了作为生产要素的数据。他们认为,“数据”可以被视为“信息”中不属于“创意”和“知识”的部分。从整体上看,对于信息的理解是由二进制位串表示的经济物品。创意和知识是信息的子类,遵循Romer (1990)等的定义,被Jones & Tonetti (2020)视为一组能够被用于生产经济物品的指令。在他们看来,所有除了创意和知识之外的其他信息都是数据。作为生产要素的数据,其本身不能被直接用于生产经济物品,但是却能在生产过程中发挥作用——如创造新的知识或者形成对于未来的预测,进而指导经济物品的生产。

(二)数据生产要素的主要特征

数据生产要素首先是一种虚拟的、存在于数据库与互联网空间中的资源。因此,大多数已有研究都将数据的虚拟性视为该生产要素的一项核心特征。虚拟性的存在就意味着数据必须以其他生产要素作为载体才能发挥作用。在当前的技术条件下,数据在大多数时候是存在于信息与通信技术(ICT)产品中的,二者的有效结合被视为目前全球经济增长的主要动力之一。虚拟性是数据与其他传统生产要素如劳动力、资本和土地的最主要差异,也是知识、技术、管理和数据等新生产要素的主要特点。对于数据等虚拟生产要素的依赖,是数字经济的主要特点之一,也是数字经济与传统经济的主要区别。除了虚拟性之外,数据还具有非竞争性、排他性、规模报酬递增、强正外部性、产权模糊以及衍生性等特征。

1.非竞争性。除虚拟性之外,数据生产要素的另外一项核心特征是非竞争性。非竞争性一般指一个使用者对该物品的消费并不减少它对其他使用者的供应。同一组数据可以同时被多个企业或个人使用,一个额外的使用者不会减少其他现存数据使用者的效用,数据也因此具有非竞争性。Veldkamp & Chung (2019)也强调,对于数据的额外使用的边际成本为0,这是数据与其他生产要素之间的一个主要差异。由于非竞争性的存在,任何数量的企业、个人或机器学习算法都可以同时使用同一组数据,而又不会减少其他人可用的数据量,这就决定了数据的高使用效率与巨大的潜在经济价值。

2.排他性。当数据的规模足够庞大、内容足够复杂和广泛时,数据生产要素就表现出高度的排他性(exclusive),拥有数据的企业和机构会选择“窖藏”而非分享数据。在现实中,大多数私营机构都不会随意公开自己产生、收集和拥有的各项数据,即使公开这些数据能够创造巨大的经济社会价值。数据的排他性还体现在,其他虚拟生产要素(如知识和技术)会随着人事变动或劳动力迁移而公开或扩散,但数据的复杂性和广泛性使其无法被包含在人力资本当中。以机器学习为例,机器学习产生的知识是公开的,而输入到机器学习算法的数据却是保密的——每一家企业都在收集自己的数据,形成训练集之后交由人工智能进行训练、学习。虽然有一些公司将自己的训练数据集公之于众以鼓励研发,然而大多数企业都将数据视为自己的一项核心竞争力而极少公开。Varian (2018)强调,数据公司可能会将一些数据整理、编制起来形成数据集和数据库,并根据某些条款向第三方出售访问和使用许可,利用排他性获得收入。例如,有几家美国的数据公司将美国人口普查数据和其他种类的地理数据合并,然后向第三方出售这些数据的使用许可权,同时禁止转售或重新许可,利用数据的排他性攫取利润。

3.规模报酬递增。数据生产要素的非竞争性进一步产生了规模报酬递增的效应。从企业的角度,其所拥有的数据可以被每一名员工使用,因而数据规模越大、种类越丰富,产生的信息和知识就越多,进而呈现出规模报酬递增的特点。如果数据对于整个行业乃至经济体的参与者开放,数据规模扩大带来的经济价值就将更为可观。Romer (1990)提出,知识的非竞争性意味着劳动力和知识的结合将形成规模报酬递增的效果。与知识相同,数据生产要素的规模报酬递增也需要与劳动力结合才能体现出来。在Veldkamp & Chung (2019)建立的包含数据生产要素的生产者模型中,商品的产量(Y)取决于生产中投入的数据量(Ω)和劳动力数量(L)。在只考虑竞争性投入(劳动力)的情况下,数据是规模报酬不变的;但若要同时考虑劳动力和数据,数据将会是规模报酬递增的,进而带来生产效率的提升。

4.正外部性。数据的正外部性首先体现在数据收集型企业生产效率的提升上。Schaefer & Sapi (2020)发现,使用雅虎搜索引擎的用户,其搜索数据显著改进了该引擎的搜索质量,进而产生了很强的正外部性。一方面,当许多用户输入同一个特定的关键词时,为该关键词收集的反馈数据量就会增加。搜索引擎会从用户在搜索结果页面上的点击行为了解用户期望得到的搜索结果,从而提高搜索质量,形成直接的网络效应。另一方面,用户使用搜索引擎的历史越长,搜索引擎的学习速度就越快,这就强化了用户数量增多所带来的正外部性。此外,数据生产要素还通过改善运营、促进创新和优化资源配置的方法,在提升企业组织效率和用户体验上实现正外部性。通过结合和分析来自样车试驾、车间报告和其他来源的数据,宝马公司可以快速发现潜在的问题和漏洞,并在新车型推出之前消除这些问题(Kshetri,2014)。IBM等拥有较强数据分析能力的科技公司,更是能在几天内完成“分析数据-发现漏洞-解决问题”的全处理过程,从而有效地优化产品维修和养护服务,提高客户满意度。

5.产权模糊性。数据生产要素在产权归属上存在一定的模糊性,其所有权和产生的各项产出在企业和消费者之间的分配尚不清晰。消费者在使用互联网公司等企业提供的各项ICT产品和服务的过程中会产生大量数据。这些数据往往由企业直接收集和整理,消费者在客观上没有处置和使用这些数据的机会。Varian (2018)认为,相较更适用于竞争性物品的“所有权”(ownership)概念,更应当关注非竞争性数据的“访问权”(data access),理由是数据很少以出售私人物品的方式进行“出售”,而是多被许可用于特定用途。例如,出于安全性的考虑,应当允许多方同时访问自动驾驶汽车的数据,包括引擎、导航系统和乘客的手机等。然而,数据的所有权也会影响数据访问权,数据产权的不同分配方式会对消费者剩余与总社会福利造成影响。

6.衍生性。各类经济活动的参与者在生产、销售和消费产品和服务的过程中,很早就开始记录各种交易、市场与用户数据,数据在大多数时候是经济活动衍生出的一种副产品,经济活动产生的数据会被金融市场的参与者深入分析,从而影响金融市场投资,进而影响实体经济。资产市场中的投资者会在经济状况良好时进行更多的投资活动,这些投资活动会产生有关当前经济状态的公共数据。如果经济状况在形势良好且数据量充足时出现波动,资产价格就会快速调整,从而导致金融市场崩盘;当经济形势不好时,数据的匮乏和高度的不确定性就会降低投资者的反应速度,反过来减少金融市场波动对于实体经济的负面影响。Ordonez (2013)提出,更大的社会投资规模会产生更多反映经济总体状况的数据,进而影响市场信贷行为。当经济整体下行时,创业投资的成功率较低,贷款者从大量创业活动失败的数据中推断出经济在下行,并迅速提高利率以应对更高的违约可能性。当经济不景气时,市场中的利率较高且借贷活动较少;而当经济状况好转时,数量有限的现存创业投资活动也只能产生相应少量的有关经济状况转换的数据,贷款人逐渐了解到这一点,并逐渐调低贷款利率,这又促进了企业投资和产出扩张。由于存在通过分析数据以协助投资决策的现实激励,生产企业和金融机构会自发地记录、整理和存储各项经济活动的有关数据,即使其主营业务与这些数据无关,而数据生产要素的衍生性就体现于此。

1 2 3 4
回到顶部