徐翔等:数据生产要素研究进展
2021年06月10日  |  来源:经济学动态  |  阅读量:23478

三、数据生产要素影响经济的微观机制

(一)数据驱动的决策过程

大数据技术的迅速发展与广泛应用,促使越来越多的企业开始从管理者主导的经验型决策转向高度依赖数据分析结果的科学决策模式,即所谓的“数据驱动型决策”(简称DDD模式)。Brynjolfsson et al (2011)构建了基于企业微观数据估计DDD模式的使用情况与贡献度的分析框架。基于美国179家上市公司的调查数据及公开信息,他们预测DDD模式可以解释2005—2009年间美国企业5%~6%的生产率增长。Provost & Fawcett (2013)从概念上区分了数据科学和数据驱动决策(DDD模式),强调了企业在决策方式转型中引入数据科学的重要性。他们将数据科学定义为通过自动化数据分析来理解各种现象的原理、过程和技术,其最终目标是改进决策质量;而数据驱动决策则是基于数据分析而非纯粹直觉的决策实践,是数据科学在企业决策中的应用方法。数据科学使大规模的自动决策成为可能,同时也依赖于企业对大数据的存储、分析和处理技术水平。与之相对的,数据驱动决策能够提高企业管理的科学性,进而提高资源配置效率和企业表现,是数据科学在企业管理上的应用形式。McAfee et al (2012)提出,相较于传统的经验型决策,DDD模式优势十分明显:充分利用DDD模式的管理者,能够基于经验证据而非商业直觉来做出企业决策,提高了决策的科学性与准确性。他们对北美330家企业公共管理实践和业绩数据进行调查研究发现,DDD模式使用程度更高的企业在财务和运营状况上有着更好的表现。进一步的实证分析显示,在一个行业中使用DDD模式占比最高的前三名企业,其平均生产效率和利润率分别会比其他竞争对手高5%和6%左右。

大数据分析带来的竞争优势促使越来越多的企业尤其是制造业企业开始转向DDD模式。在2005—2010年间,美国制造业中使用DDD模式的企业占比从11%增长到30%,预计到2020年这一比例将超过50%,DDD模式已然成为美国制造业的“新常态”。Brynjolfsson & McElheran (20 16b)基于2005年和2010年美国人口普查局 (USCB)的年度制造业调查 (ASM)以及管理和组织实践调查 (MOPS)数据,实证研究了美国制造业企业对于DDD模式的使用情况及其经济影响。回归结果显示,属于多生产单位型企业的大型工厂更多且更早地使用DDD模式,并通过这一转变提升了企业绩效。随着时间推移,DDD模式的先行者和后来者之间的绩效差距会减小。此外,DDD模式和ICT资本规模以及技术工人数量等变量之间还存在相互促进的互补关系。

虽然许多企业都在通过投资于ICT和大数据来转向DDD模式,但该模式存在的一些客观不足也开始逐渐显现。Brynjolfsson & Mitchell (20 17)通过一项决策实验比较了机器学习领域中的“学徒系统”与一般企业管理者决策之间的效率差异。“学徒系统”是一种特殊的DDD模式。在这一系统中,人工智能程序充当学徒协助人类工作者,通过观察人类的决策进行学习,并将这些人类决策作为训练自己的示例。机器从它所协助的多个人类个体的组合数据中进行学习,按照大数据与人工智能的基本理论,机器将会做出比训练它的团队中的每一个人更优的决策。然而,实验结果显示,机器学到的专业知识仍可能会受到团队技术水平与相关决策变量的在线可用性的限制,在现实中做出的决策未必会比管理者基于经验做出的结论更好。Bajari et al (2019)对于亚马逊的产品销售量预测系统的实证分析表明,产品在市场上销售时段的增加产生的额外数据会提升预测表现,同一产品种类中的产品数量增长产生的额外数据则无法改进预测质量,说明不同类型的数据对于数据驱动的决策和预测的影响存在异质性。上述研究表明,简单地加大在数据生产要素上的投资力度未必会提升企业的决策质量,需要进一步分析数据驱动决策的作用机制,并意识到数据驱动型决策的局限性,人类和机器在决策上的表现各有所长。

企业转向数据驱动型决策的过程并不是一蹴而就的,需要面对诸多管理上的挑战。为了采用DDD模式,企业需要对管理模式进行深入改革。企业高层决策者必须要逐渐接受数据驱动的、基于实证证据的决策方式,而企业为此需要额外雇用能够发现数据中的模式规律并将其转化成可用商业信息的数据科学家或数据策略师。整个企业的组织结构都必须围绕DDD模式进行调整。Janssen et al (2017)也指出,影响数据驱动决策质量的相关因素还有很多,大数据和大数据分析未必能带来更好的企业决策。一方面,大数据的多样性和大数据分析的广泛使用,增强了企业发现欺诈行为的能力,从而有利于防止决策错误;但另一方面,它同样也可能加剧对于用户和消费者的歧视,带来额外的社会福利问题。

事实上,不仅仅是企业决策,数据生产要素也具有改进政府政策决策的可能性。Hochtl et al (2016)通过构建一个政策周期模型,证明大数据分析能够改进政府的政策决策过程。在大数据分析的支持下,政府在设计和实施政策计划中不应一味遵从分阶段连续执行的传统模式,而应该在每一个阶段对政策措施的当前效果进行持续评估,通过采用大数据情景分析实时制定替代方案。在必要时应该提前放弃先前计划的政策,通过实时决策提高政策制定的效率。此外,由于能够更快、更好地处理收集到的大量未结构化信息,大数据分析能够在政策周期的每一个阶段都实现公众的广泛参与,从而能够更充分地集思广益。随着更多数据通过预测分析技术转化为可用信息并指导决策,社会部门可以更合理地将社会支出分配到需要改善的领域,以此提高社会福利水平。

(二)数据生产要素与生产效率

除了驱动企业决策外,数据还能直接提升企业的生产效率。Müller et al (2018)使用计量方法对大数据分析和企业生产效率之间的关系进行了实证研究,通过将2008—2014年间814家美国企业对于大数据分析的使用情况与Compustat数据库中的财务绩效数据相结合,结果发现,对于样本中的所有企业来说,拥有大数据分析会使平均生产率提高4.1%;具体到行业层面,企业生产率的大幅提升与大数据分析高度相关:大数据分析使得信息技术密集型行业的生产率提高6.7%,竞争性行业的生产率提高5.7%。这无疑为大数据分析的商业价值提供了有力的实证证据。具体来看,已有研究归纳了数据提升企业生产效率的三种主要实现机制:信息挖掘、协同创新和产品质量提升。

个体和企业在竞争激烈的环境中生存有赖于在正确的时间掌握正确的信息,数据生产要素正是正确信息的重要来源。一方面,企业通过大数据分析可以提高组织内部信息的透明度,从而产生更广泛、更深入和更准确的观察,进而改进决策的质量。另一方面,企业能够利用大数据刻画出更复杂、更完整的客户画像,从而有针对性地提供更准确的定制产品和服务,进而提升生产效率。从这个角度来看,数据生产要素可以被视为一种能够提高企业生产效率的信息资产。能有效利用数据(指从每单位生产中获取更多数据)的企业,在开始时可能会因为建立自己的数据库而产生亏损。然而,如果企业能够在这一阶段顶住财务压力而对数据类投资予以持续的资金支持,就能够迅速超越规模更大但数据利用效率低的企业。

数据生产要素提升企业生产效率的第二个机制是鼓励企业间的协同创新。创新本身是一个试错的过程,研发过程中的失败尝试所形成的大量数据和信息对企业也具有重要意义。如果企业之间不能进行信息共享,那么研究的时间和资源就很可能浪费在其他企业已经发现毫无结果的项目上,从而导致无效率的均衡。Akcigit & Liu (20 16)建立了一个“赢家通吃”的动态博弈模型研究这一问题,发现竞争性企业的博弈结果是:要么重复进行高失败风险的实验,希望通过某次幸运的成功带来高额回报;要么提前放弃风险研究,中止创新进程。这两种选择均会因为信息外部性的存在引发显著的效率损失。反之,如果企业能够交流、共享研发过程中的各种数据,便能够显著提高创新活动的效率,进而实现生产效率提升。

除了信息挖掘与协同创新之外,企业还能利用数据预测并选用最优的生产技术,进而改善产品质量。Farboodi & Veldkamp (2018)仿照索洛的经典新古典增长模型中对资本流入和流出的分析,对数据的“流入”(经济活动产生的新数据)和“流出”(数据的折旧)进行了理论建模。模型结果显示,当数据存量非常低时,新产生的数据量远远大于数据的折旧量,数据生产要素会快速积累,产品的质量和价值也会随之快速提高;而随着数据存量的增加,数据流入的速度会逐渐放缓,新产生的数据量与折旧量之间的差距变得越来越小。最终,数据流入和流出交于一点,数据经济达到稳态均衡水平,此时数据存量、产品质量以及GDP都将保持不变。由此可见,当数据量积累到一定程度时,收益递减的力量就会占据主导地位。而在数据量不够充足时,“数据反馈循环”将会产生递增的回报——拥有更多数据的企业会生产更高质量的产品,这又会促使这些企业增加投资、生产和销售,进而生成更多数据。Veldkamp & Chung (2019)进一步指出,数据帮助企业选择更好的生产技术的渠道有两种:一方面,交易记录会揭示消费者的偏好,帮助企业了解消费者更加偏好何种颜色的鞋子、何种动力的汽车等,从而可以进行针对性的生产;另一方面,消费者的偏好是在持续不断地变化当中,企业必须始终保证自己能够适应这种变化。通过对生产和销售过程中产生的数据进行分析,企业可以获得指导其最优化自身运营实践的有用信息。

(三)数据生产要素与产业组织

产业组织理论关注一个行业内不同企业间的组织或者市场关系。企业拥有的数据生产要素规模与其在ICT技术上的投入密切相关。这一投入与企业规模之间又相互影响,进而影响企业动态与产业组织方式。因此,对于数据生产要素与产业组织之间关系的研究,就应该首先关注不同规模企业的ICT投入。鉴于以往研究企业层面ICT资本生产率的文献的数据来源相对单一,Tambe & Hitt (2012)构建了一个新的面板数据集,基于约1800家企业在1987—2006年间的ICT从业人员数量以及相匹配的生产投入,研究企业ICT投资与企业规模之间的关系。研究发现,中型企业的ICT投资回报显著低于名列《财富》世界500强的大型企业,ICT投入的边际产出在2000—2006年间比以往任何时期都高,这表明企业(尤其是大型企业)对于ICT技术的使用效率得到了显著提升,这很有可能是规模更大、种类更加丰富的数据生产要素带来的结果。

Begenau et al (2018)提出,现代经济的两大发展趋势是企业规模的扩大与ICT技术的进步,数据生产要素对于这两种趋势的形成均做出了一定贡献。作者建立了一个企业重复静态博弈模型,得出两个核心结论:首先,大企业比小企业更擅长利用金融市场中的大数据来降低资本成本;其次,大型企业因为有更多的经济活动和更长的经营历史,从而产生了更多可供处理的数据。随着计算机性能的提高,丰富的数据也支持了更多的财务分析。数据分析改善了投资者的预测质量,减少了股票投资的不确定性,降低了企业的资本成本。当投资者能够处理更多的数据时,大企业的投资成本会下降得更多,从而使其规模变得更加庞大。Farboodi et al (2019)采取了类似的建模方法,在重复静态博弈模型中引入了一个名为“数据精通”的新变量用于描绘企业对于数据使用的精通程度,并通过求解这一模型他们发现:首先,数据有助于企业提高生产率,更高的生产率使得企业进行更多投资,规模变得更大,从而生产出更多的数据,构成了一个“数据反馈循环”;其次,由于额外的生产过程会产生更多数据,企业为了获得更多、更好的数据会进一步增加投资,数据质量也因此得到显著改善。

数据生产要素的积聚还在一定程度上导致了“超级明星公司”的出现。Autor et al (2020)认为,在ICT技术和包括数据在内的无形资本上的竞争优势催生了超级明星公司,这些公司具有高附加值和低劳动力份额的特点,造成产品市场集中度的显著上升,以及宏观意义上劳动收入份额的下降。Tambe et al (2020)提出了“数字资本”的概念,用于指代数字技术密集型企业对实现新技术价值所需的无形资产进行的投入(如员工ICT技能培训、企业决策结构和软件定制等方面的累计投资等),通过创建一个关于ICT相关劳动力投入的企业面板数据库进行研究发现,在大多数“超级明星公司”中积聚了大量数字资本,进而导致了一定程度的垄断。Ciuriak (2019)分析了过去三百多年的经济史中要素租金的分配方式,指出数据生产要素的集聚产生了大规模的租金,催生了超级明星企业,并为战略性的贸易和投资政策产生了强有力的激励。

(四)数据生产要素与信息摩擦

对于金融市场来说,数据生产要素是投资决策的核心参考变量,发挥了降低信息摩擦的重要作用。计算机技术的进步使科技公司能够收集实时、精确的基本面指标,并将其出售给专业投资人士。这些数据通过降低信息获取成本而提高了金融产品中的价格信息含量,这对投资者产生了两个主要影响:一方面,当价格迅速而全面地反映未来收益时,经理人就很难有机会利用其内部信息优势获取个人交易收益;另一方面,关于基本面的数据揭示了企业当前业务的衰退趋势或在未来实现增长的机会,可以指导投资者在状况恶化时减少投资,在机会扩大时增加投资,从而提高投资效率。

随着金融科技技术的不断创新与应用,金融交易的价格信息含量总体上呈现上升趋势。Farboodi & Veldkamp (2020b)探讨了金融部门信息处理效率的确定性增长所带来的结果。由于其他投资者的需求数据能够协助投资者抵御需求冲击,因此当金融部门的信息处理效率提高时,获取未来股息(基本面)与需求(对价格的非基本面冲击)信息的动机就会发生改变,企业会选择处理越来越多关于其他投资者需求的数据,而不是企业的基本面数据。因此,信息处理效率的提升也就可以解释为什么金融分析从一个主要调查企业基本面盈利能力的部门,转变成了一个做少量基本面分析而主要集中于获取和处理客户需求的部门。虽然对于基本面数据的分析在减少,但是金融产品的价格信息含量仍然会上升,投资者可以借此更好地预测资产回报并规避投资风险。

根据金融资源配置的基本逻辑,随着越来越多的技术被用于处理和传输金融数据,资本确实会得到更有效的配置,从而增加社会收益。Bai et al (2016)建立了一个衡量股票价格中信息含量的新指标,并通过计算该指标发现,1960年以来标准普尔500指数的股票价格在预测公司未来收益上的能力已经提高。Farboodi et al (2018)提出了另一种观点:大数据技术的进步引发了股票市场上的结构效应,即以标准普尔500指数中的企业为代表的历史悠久的大企业的股票价格信息含量显著提高,其他中小企业的股票价格信息含量却有所下降。换言之,金融大数据的发展对于股价信息含量的影响具有规模异质性。受益于大数据技术,大企业股票的定价变得更为准确,但中小企业股票价格的实际信息含量并没有实质性的提升,因而对于总体市场来说,大数据技术的进步对于价格信息含量的提升有限。

除了影响价格信息含量外,大数据分析技术还降低了贷款信用风险管理中的信号传递和信息搜索成本,减少了借贷过程中存在的信息不对称性问题。在对金融市场中的信息摩擦现象进行分析时,Yan et al (2015)以P2P贷款平台为对象,发现了大数据分析在贷款行业中对减少信息摩擦所起到的积极作用。由于借贷过程中存在信息不对称问题,借款人会发出信号并传达有关其本人和投资项目特征的信息,而贷款人则需要搜索信用记录等信息并筛选贷款申请人。在传统的银行体系中,银行进行贷款决策并负责信用信息的收集和评估。而随着ICT技术的不断突破,基于大数据的金融科技已经成为贷款行业中的一个颠覆性驱动力,企业收集、呈现和评估信息的手段变得更加先进和丰富,信用信息的检索成本大幅度降低,信用数据的收集也从被动的信息检索转变为主动的信息收集。

大数据、ICT与人工智能等新技术的发展改变了金融行业的基本经营方式与盈利逻辑,推动了金融行业的全面转型升级。Vives (2019)调查了银行业的技术革新,并考察了其对行业竞争的影响以及效率提高和客户福利的潜力,认为银行业正在进行从依赖实体分支行开展业务向依赖ICT技术、大数据以及高度专业化的人力资本的系统性变革。随着数字化水平的提升,银行在支付和咨询服务等核心业务上面临着相较于其他中介机构更大的竞争威胁。新近崛起的金融科技部门开始在金融服务中使用创新的信息和自动化技术,使得数字技术的采用速度以及相关用户的获取速度都显著加快。

1 2 3 4
回到顶部