-
一、 引言
-
2020年4月9日,《中共中央国务院关于构建更加完善的要素市场化配置体制机制的意见》正式出台,首次明确数据第五大生产要素的重要地位,标志着我国要素市场化改革迈入新阶段。这一重大制度创新,不仅确立了数据在现代经济体系中的核心地位,更使其成为驱动社会经济创新发展、推动产业转型升级的关键引擎。[1]然而,受区域资源禀赋、数字基础设施建设水平及政策执行能力差异的影响,我国各省份在数据要素的开发、流通与应用方面呈现出明显的发展不平衡态势。[2]在此背景下,数据要素在激发省域数据资源潜能、促进区域内数据场内交易规模化扩容等方面所发挥的作用存在显著区域差异。[3]部分省份已初步构建起“数据资源—数据资产—数据资本”的转化链条,而另一些省份仍处于数据管理的初级阶段,要素价值释放不足。
-
2022年12月19日,《中共中央国务院关于构建数据基础制度更好发挥数据要素作用的意见》(以下简称“数据二十条”)对外发布,从数据产权、流通交易、收益分配、安全治理等方面构建数据基础制度,提出20条政策举措。 2025年1月,国家发展改革委印发《关于完善数据流通安全治理更好促进数据要素市场化价值化的实施方案》,对数据要素市场化建设的具体路径、重点任务作出系统部署。2025年4月,为贯彻落实“数据二十条”各项任务,国家数据局印发《构建数据基础制度更好发挥数据要素作用2025年工作要点》(以下简称《工作要点》),从数据产权、流通交易、收益分配、安全治理四个维度细化任务,聚焦解决数据“供得出”“流得动”“用得好”“保安全”的卡点堵点,形成“顶层设计—实施部署—具体落地”的完整政策链条,倒推出数据要素发展水平测度工作的重要现实意义。
-
因此,科学构建省域数据要素发展水平测度体系,全面评估各地区在数据供给、流通效率、应用与治理等方面的综合表现,精准识别区域发展差异的结构性特征,已成为制定差异化支持政策、优化全国数据要素布局的迫切需求。这不仅有助于弥合区域间“数字鸿沟”,也对推动东中西部协调发展、构建全国统一开放的数据要素市场体系具有重要的战略价值。
-
二、 文献综述
-
数据要素具有虚拟形态属性、非排他性、规模报酬递增效应及产权模糊性等不易计量的典型特征[4-5],已有研究从不同视角对其发展水平进行刻画。例如,王开科等[6]以国内生产总值(GDP)核算为核心,开展数据要素资本化核算基本问题、理论机理和账户影响研究;欧阳日辉等[7]考虑到数字产品场景交易的差异化特征,提出数据要素估值指标体系应采用“普适性基础框架+特定领域/行业专项指标”的组合形式,确保估值逻辑既符合共性规律,又贴合细分场景需求;许宪春等[8]在国民经济核算框架下,从理论、方法与应用分析3个层面开展国际可比口径的数据资产测算研究;张虎等[9]运用核密度估计、变异系数等方法对区域层面的要素市场化配置水平差异进行了研究;刘五星等[10]从数据要素支撑、数据流通应用、数据市场生态和数据治理保障四大维度,构建数据要素市场发展指数体系;Tao等[11]基于数据要素的依赖性、非排他性与渗透性等核心特征,开展数据要素发展水平的多维度测度研究;Faroukhi等[12]认为数据价值链的核心环节涵盖数据生成、数据收集、数据分析与数据交换4个维度;Curry[13]创设“数据采集—数据管理—数据存储—数据分析—数据利用”五环节体系,明确各阶段核心职能与衔接逻辑;陶长琪等[14]遵循“投入—产出效益”的全流程,从数据要素供给源头、处理维护环节、发展支撑保障与应用效益转化4个维度,构建兼具逻辑性与实操性的数据要素指标体系;王家明等[15]立足数据要素市场化基础支撑、开发转化效能与市场规模拓展3个层面,创设市场化配置效率的综合评价指标;杜传忠等[16]、Yan等[17]则将数据交易平台建设作为数据要素市场化的反映。
-
与既有研究相比,本文的边际贡献主要体现在两个方面:一是从基础配置、价值转化、行业渗透与标准管理4个维度构建了更为科学全面的数据要素发展水平评价指标体系;二是采用Dagum基尼系数法,探究数据要素发展水平的地区差异,并通过核密度估计法揭示其演进趋势,细致刻画数据要素发展状态,为相关政策制定提供参考。
-
三、 研究设计
-
(一) 评价指标体系
-
本文以“数据二十条”和《工作要点》为根本指引,充分回应其“保安全”的要求; 同时借鉴潘宏亮等[18]构建的“数据支撑—数据转化—数据应用”三维度模型,以及列斐伏尔(Lefebvre)三元空间理论中关于物理空间(地理环境与基础设施)、信息空间(数据流动与技术体系)和社会空间(制度规范与社会关系)相互作用的洞见[19],从基础配置、价值转化、行业渗透与标准管理4个维度切入,构建科学全面的省域数据要素发展水平评价指标体系(见表1)。该体系严格对应数据要素发展的核心维度:基础配置维度匹配数据供给能力,价值转化维度对应数据流通效率,行业渗透维度体现数据应用深度,标准管理维度保障数据治理能力,形成“供给—流通—应用—治理”全链条逻辑闭环。本文多采用相对指标来反映各地区的数据要素发展情况,以减少区域异质性带来的影响并增强数据的可比性[20],为后续发展水平测度与区域差异分析奠定基础。
-
1. 评价指标体系的系统逻辑与维度关联
-
基础配置、价值转化、行业渗透与标准管理4个维度构成相互支撑、层层递进的有机整体,完整覆盖数据要素从“资源”到“要素”再到“生产力”的全链条发展过程。
-
(1)基础配置。作为数据要素发展的“硬件底座”,数字基础设施的覆盖广度与密度直接决定数据资源的供给规模与质量,是数据要素流通和价值转化的前提保障。
-
(2)价值转化。作为“核心环节”,数据要素通过产业转化实现从“资源”到“资产”的价值跃迁,这一过程依赖数据的高效流通与交易,流通效率越高,价值转化的速度与质量越优,是连接基础配置与行业渗透的关键桥梁。
-
(3)行业渗透。数据要素的最终价值通过在各行业场景的深度应用得以释放,应用程度越深、覆盖范围越广,数据要素对经济社会发展的赋能效应越显著,是价值转化的最终体现。
-
(4)标准管理。完善的制度规范与治理体系能够破解数据流通中的安全隐患、开放共享的规范程度、社会诉求与监督力度等难题,为基础配置优化、价值转化提速、行业渗透深化提供良好的制度环境,是数据要素持续健康发展的重要制度保障。
-
四个维度相互依存,构成动态循环:基础配置的完善为价值转化提供物质基础,价值转化的成效为行业渗透提供动力,行业渗透的需求反向推动基础配置升级,而标准管理贯穿始终,保障整个体系的有序运行。
-
2. 各维度指标选取依据
-
(1)基础配置水平。数据要素的高效流通与价值释放离不开底层基础设施的支撑,这一维度是数据要素发展的“硬件底座”。参考“数据二十条”中“夯实数据要素发展基础”的要求,选取域名数等5个指标,衡量省域数据网络、通信设施的覆盖广度与密度[21];同时采纳每百家企业拥有网站数,反映市场主体数字化触网的基础水平,为数据要素的生产、采集提供设施与主体保障[22],直接体现区域数据供给的硬件支撑能力。
-
(2)价值转化水平。数据要素的核心价值在于通过产业转化实现经济赋能,这一维度对应数据要素从“资源”到“资产”的价值跃迁过程。[23]借鉴相关研究[24-26],选取人均软件业务收入等4个指标,刻画数据要素在软件产业、技术交易、信息服务等领域的直接价值产出,这些指标从产业规模、交易活跃度等层面,反映数据要素流通效率与价值转化的“软能力”。
-
(3)行业渗透水平。数据要素的价值最终通过行业场景的深度渗透实现普惠化发展,这一维度体现数据要素在重点领域的应用广度与深度。参考吕伊姝等[27]、Hagiu等[28]的研究,选取数字金融覆盖广度等3个指数,衡量数据要素在金融领域的渗透水平;结合开展电子商务交易活动企业比重等3个指标,反映数据要素在商贸流通、企业运营中的场景化应用成效,体现数据要素对传统产业数字化转型的赋能效应。
-
(4)标准管理水平。数据要素安全发展并非易事[29],结合《工作要点》中“保安全”的要求,新增数据要素标准管理维度。选取政府网络透明度等4个指标,从政府数据服务与政策规制层面,衡量数据要素发展的制度环境与管理规范水平,进一步完善数据要素发展水平的评价维度,确保指标体系既涵盖硬设施、软价值、场景渗透,又体现制度标准对数据要素发展的保障与治理作用。
-
本研究选取2011—2023年我国30个省份(剔除了西藏和港澳台地区)的面板数据,数据主要来源于国家统计局、北京大学数字金融研究中心、《中国工业统计年鉴》《数字中国发展报告》《中国电子信息产业统计年鉴》《中国统计年鉴》《中国政府网络透明度指数评估报告》、各省份统计年鉴、国家市场监督管理总局官方网站、政府网站年度报表及EPS数据库等,对于部分缺失数据,使用插值法予以补齐。
-
(二) 研究框架
-
本研究遵循数据要素“发展水平测度—差异来源识别—时空演化分析”的核心逻辑,构建系统的研究框架,并明确各环节技术路径与方法选择依据。
-
1. 研究流程设计
-
(1)数据预处理:收集2011—2023年30个省份多维度原始数据,通过插值法补齐缺失值,确保数据完整性;对不同量纲指标进行标准化处理,消除区域异质性干扰。
-
(2)权重确定与水平测度:基于指标信息离散程度,采用熵权法计算各维度及三级指标权重,构建综合评价模型,测算省域数据要素发展水平指数。
-
(3)差异分解与成因分析:通过Dagum基尼系数分解,将总体差异拆解为区域内、区域间及超变密度贡献,精准识别差异核心来源。
-
(4)时空演化分析:在时间维度上,运用核密度估计法揭示发展水平的动态演进趋势;在空间维度上,结合热力图分析,呈现区域梯度分布特征。
-
2. 方法选择与适配性说明
-
(1)熵权法:该方法能基于指标原始数据的信息熵自动确定权重,避免主观赋权的偏差,且适配多维度、多指标的综合评价场景,与本文指标体系的量化需求高度契合。为规避其可能弱化“重要但变动小”指标的局限,本文采用2011—2023 年面板数据,并通过“指标筛选—权重校验—综合解读”三重机制确保权重确定的科学性与合理性。
-
(2)Dagum基尼系数:相较于传统基尼系数,其优势在于能有效处理样本交叉重叠问题,实现区域差异的精准分解,满足本文对区域差异来源的深度探究需求。
-
(3)空间热力图分析:借助Origin软件与自然间断点分级法,直观呈现省域数据要素发展水平的空间梯度分布、集聚特征与时空演化规律。
-
(4)系统聚类法:用于分阶段识别省域数据要素发展的梯队集聚特征。通过层级聚类清晰划分不同发展阶段的省域梯队,直观呈现样本期内省域发展的集聚分化过程与阶段化演进特征,与本研究分时段的集聚分析需求高度适配。
-
(5)核密度估计法:该方法无需预设分布形式,直观呈现数据要素发展水平的分布形态、集中趋势与演化特征,适用于刻画省域层面的动态发展规律。
-
(三) 研究方法
-
1. 熵权法
-
本文参考王军等[30]的做法,使用熵权法对数据要素发展水平指标进行确权,并计算数据要素发展水平指数。
-
鉴于不同指标有着不同的量纲与数量级[31],需要对其进行标准化处理:
-
计算第j项指标下第i个样本值所占的比重:
-
计算指标的信息熵:
-
计算信息熵冗余度:
-
计算各项指标权重,m为评价年度:
-
计算数据要素发展水平指数:
-
其中,zi表示i省份数据要素发展水平综合指数,取值在0-1之间。zi越大,表示数据要素发展水平越高;反之,则表示数据要素发展水平越低。
-
2. 核密度估计法
-
本文运用核密度估计法,对我国省域层面数据要素发展水平的分布态势与演变规律进行量化刻画。随机变量x的核密度函数为
-
其中,K(x)表示核函数,xi表示i省份的数据要素发展水平值,μ表示均值,n表示观测值的个数,h表示窗宽。
-
3. Dagum基尼系数
-
考虑到样本可能存在分布交叉重叠问题,本文运用Dagum基尼系数法分析我国数据要素发展水平的异质性特征。[32]此方法的显著优势在于能将地区间不平衡问题拆解为地区内部不平衡、地区之间不平衡以及超变密度三部分,其中超变密度特指因地区间发展特征重叠而导致的地区不平衡形态。因此,Dagum基尼系数(G)可分解为区域内差异贡献(Gw)、区域间差异贡献(Gb)及超变密度贡献(Gt)三部分。相关计算公式为
-
总体差异G可表示为
-
其中,G表示总体基尼系数;n表示省份个数;m表示划分地区个数;nj和nh分别表示在j地区与h地区内的省份个数;xji及xhr分别表示j地区与h地区内某一省份的数据要素发展水平。
-
四、 省域数据要素发展水平测度结果分析
-
(一) 整体分析
-
1. 权重测算
-
运用熵权法对数据要素发展水平各级指标权重进行测算,结果如表1所示。其中,行业渗透水平权重最高(0.340),反映出数据要素的价值最终需通过电商、数字金融等行业场景的深度渗透实现;基础配置水平权重次之(0.302),体现了网络设施、通信基站等“硬件底座”是数据要素生产、流通的前提,其区域差异直接影响数据要素发展的起点;价值转化水平权重为0.245,说明数据要素向经济价值的转化能力是其核心属性;标准管理水平权重最低(0.113),这与该维度指标多属政务数据开放和政策文件等“软性指标”、区域间差异相对较小且对数据要素发展的影响有关。整体而言,权重分布既客观反映了各维度指标的信息离散程度,又与数据要素发展的逻辑相呼应,为后续省域数据要素发展水平的测度提供了科学的权重依据。
-
2. 省域数据要素发展水平测算
-
从表2可以看出,我国省域数据要素发展水平呈现明显的梯队特征:以北京、广东、江苏、浙江、山东、上海为代表的沿海或经济发达地区,数据要素发展总体处于领先水平,这些省份凭借完善的数字基础设施、活跃的数据要素市场与领先的数字产业生态,成为全国数据要素发展的引领者;福建、四川、湖北等省份,在数据要素的行业渗透(如电子商务、数字金融)或区域政策支持(如数据要素试点)下,形成了局部优势或特色优势,发展势头平稳,但与头部省份相比仍存在一定差距;吉林、黑龙江、青海、宁夏等省份,数据要素发展水平则相对较低,这类省份受限于经济规模、数字基础设施密度与产业数字化程度,数据要素的生产、流通与应用环节均存在短板,发展动能相对不足。
-
基于上述分析,本文参照沈小波等[33]的研究,将30个省份划分为东、中、西三大区域,对各区域的年均数据要素发展水平进行对比分析(见图1)。
-
如图1所示,东、中、西三大区域的数据要素发展水平均呈逐年上升态势,但区域间发展格局呈现“东部领先、西部滞后”的特征,东部地区数据要素发展水平年均值显著高于西部地区。数据要素的发展可能加剧要素空间集聚的不平衡性,引发中、西部地区要素向东部地区流动的虹吸效应,最终呈现“强者更强、弱者更弱”的马太效应。
-
3. 省域数据要素发展水平的空间分布格局
-
本文借助Origin软件绘制热力图,从省城—年份二维视角呈现2011—2023年我国数据要素发展水平的空间分布情况,并用自然断点法将数据要素发展水平划分为10个连续梯度区间,采用10级色阶渐变,直观反映发展水平的梯度差异,结果如图2所示。
-
图1 区域年均数据要素发展水平变化趋势
-
研究发现,我国数据要素发展水平有明显的区域梯度分布和动态演进特征。北京、上海、广东、江苏、浙江等东部沿海省市,凭借深厚的数字经济底蕴、前瞻性的政策布局和旺盛的市场需求,长期处于数据要素发展的高水平区间,形成了稳定的核心聚集区;四川、安徽、湖北等中部和西南部分地区省份,依托区域发展战略(如长江经济带建设)、数字政府创新实践与产业数字化转型,数据要素发展水平迅速提升,呈现出从东部核心区向中部、西南地区跨区域扩散与跃升的态势;青海、新疆、甘肃等西部省份,受限于经济基础薄弱、数字基础设施滞后和政策资源相对不足,数据要素发展水平长期处于低位,成为全国数据要素协调发展的瓶颈区域。从时间演进看,数据要素发展的区域梯度格局随时间推移愈发清晰且呈现扩散趋势。早期仅东部沿海少数省份处于高水平状态,而后中部及西南部分省份快速跟进,形成“东部引领—中部跃升—西部待兴”的动态格局,反映出数据要素发展在区域间的传导效应与梯度差异长期存在。
-
图2 我国数据要素发展水平省域空间分布热图
-
(二) 区域差异分析
-
1. 数据要素发展水平总体差异及贡献来源
-
借助Dagum基尼系数,计算2011—2023年我国数据要素发展水平的总体差异、区域内差异、区域间差异、超变密度及其贡献率,结果如表3、图3所示。
-
我国数据要素发展水平的区域间差异贡献最大,贡献率年均高达71.52%,表明区域间经济基础、数据基础设施与政策资源的差距是发展不平衡的核心因素;其次是区域内差异,贡献率年均22.08%,说明区域内部各省份间的发展不均衡问题也较为突出;超变密度的贡献率反映了数据要素发展中各地区的交叉重叠问题,对总体差异的贡献率最小,仅为6.40%。总体基尼系数的年均值为0.338,总体差距基本上处于波动下降的趋势,从2011年的0.385降至2020年的0.273,后略有回升,表明数据要素发展水平差距出现收敛迹象。
-
图3 Dagum基尼系数贡献率
-
2. 数据要素发展水平区域内差异特征分析
-
从区域内基尼系数的演变特征来看(见图4),我国数据要素发展水平的区域内差异呈现西部差异最大、中部次之、东部最小的层级格局。从时间趋势看,东部地区区域内差异呈波动收敛态势,中部地区差异在波动中略有调整,西部地区内部差异虽有波动但整体仍维持较高水平。
-
图4 数据要素发展水平区域内差异演变
-
究其原因,东部地区数字基础设施完备、经济与人才支撑充足,数据要素发展基础扎实,但各省在数据创新能力、政策落地成效等方面存在差异,部分省份依托产业集群快速突破,个别省份受结构转型滞后等因素制约,区域内发展不均衡;中部地区区域协调发展势头迅猛,数字基建与应用场景持续拓展,但省份间在基建完备度、转型进度上节奏不一,部分省份承接产业转移成效显著,少数省份受资金、人才限制发展较慢,使得区域内部差异呈现波动;西部地区部分省份受限于数字基础薄弱、市场培育缓慢,而重庆、四川等省份依托政策支持、产业布局及东部资源外溢快速发展,形成鲜明发展差距,进一步加剧了区域内发展落差。
-
3. 数据要素发展水平区域间差异特征分析
-
从区域间基尼系数的演变特征来看(见图5),“东—西”区域间差异长期处于最高位,2011年接近0.6,后续虽有波动但始终维持在0.45以上;“东—中”区域间差异处于中间层次,后缓慢下降并稳定在0.35~0.45区间;“中—西”区域间差异最低,整体呈缓慢下降趋势,后期稳定在0.1~0.2区间。究其原因,东部在数据创新能力、数字产业集聚度、政策试点深度等方面优势显著,而西部部分省份受限于数字基础薄弱、数据要素应用场景不足,仅重庆、四川等少数省份能承接东部产业与数据资源外溢,区域间发展落差难以快速弥合;“东—中”“中—西”差异的收敛则得益于中部、西部在数据基础设施建设(如中西部数据中心布局)、政策红利释放(如数字经济扶持政策)等方面的持续发力。
-
图5 数据要素发展水平区域间差异演变
-
(三) 动态演进特征分析
-
1. 省域数据要素发展的空间集聚演变特征
-
为探究数据要素发展的空间集聚规律,借助Origin软件绘制2011—2023年分阶段省域数据要素发展水平聚类图,将研究期划分为2011—2013年、2014—2017年、2018—2020年、2021—2023年四个时段,直观呈现省域数据发展水平的集聚特征与时空演变规律,结果如图6所示。
-
研究发现,2011—2013年,全国省域数据要素发展的整体最大聚类合并距离约为0.22,为全样本期内最低值,表明该阶段省域间发展水平整体差异较小,低水平同质化特征显著。从聚类结果来看,全国省份可划分为两大核心分支:第一分支为北京、江苏、浙江、广东4个省份,在0.05~0.15的低距离区间内完成聚类,形成全国首个高水平集聚梯队,显现出初步的领先优势,但分化幅度相对有限;其余26个省份在0.12的距离阈值内完成整体聚类。表明除少数头部省份外,全国绝大多数省份数据要素发展均处于起步阶段,发展水平相近、差异微弱,尚未形成明显的次级梯队分化。
-
2014—2017年,全国省域数据要素发展的整体最大聚类合并距离提升至0.42,较前一阶段近乎翻倍,省域间发展水平的整体差异显著扩大,梯度分化格局开始显现。头部梯队仍以北京、广东、江苏、浙江4省为核心,类内合并距离略有提升,说明头部省份内部开始出现小幅发展差异。与此同时,其余省份的聚类层级明显增多,分化为多个次级分支:天津、陕西、重庆、辽宁等省市率先形成中高水平次级集群,与西部欠发达省份的合并距离提升至0.18,打破了此前的低水平同质化格局,中部及西南部分省份依托政策红利与产业基础进入快速追赶阶段,“头部引领—中部追赶—西部滞后”的三级梯度雏形基本形成。
-
2018—2020年,整体最大聚类合并距离进一步升至0.58,省域间发展差异持续拉大,数据要素发展的马太效应逐步显现,清晰的梯度分化格局完全成型。头部梯队北京、江苏、浙江、广东的类内合并距离回落至0.05以内,说明头部省份间发展协同性持续增强,高水平集聚特征更加稳固,与其他省份的分化程度持续加深。次级梯队的分化更加清晰:上海、山东、福建形成东部沿海次高集群,四川、湖北、安徽、湖南等长江经济带省份形成中部追赶集群,两大次级集群与西部欠发达省份的合并距离提升至0.22。至此,全国形成“核心引领区—快速追赶区—潜力发展区—低水平滞后区”的四级聚类格局。
-
图6 全国数据要素发展水平省域集聚度演变
-
2021—2023年,整体最大聚类合并距离突破0.95,达到样本期内峰值,省域间数据要素发展水平的分化程度达到最高,集聚格局呈现出“强集聚、大分化、稳梯队”的核心特征。从聚类结果来看,头部集聚格局发生优化调整,北京、江苏、浙江、上海、山东在0.25的距离内形成紧密的核心引领集群,类内协同性进一步提升,长三角、京津冀、山东半岛的区域联动效应凸显,发展水平高度趋同且持续领跑全国。整体来看,四大梯队的边界更加清晰,梯队内部的合并距离普遍低于0.15,而梯队间的合并距离均高于0.4,表明我国省域数据要素发展已形成稳定的梯度集聚格局,区域间分化与区域内集聚并存,核心引领区的辐射带动作用逐步释放,但全国整体发展差距仍处于高位。
-
2. 区域数据要素发展的梯度差异演变特征
-
从图7所示的分区域核密度分布曲线图可知,全国及东、中、西部数据要素发展水平的核密度曲线均呈现单主峰特征,说明我国整体及东、中、西部数据要素发展水平未出现两极分化,发展态势相对集中。
-
峰值高度的差异直观体现了区域间数据要素发展的梯度格局:东部地区核密度曲线波峰显著高于全国及中部、西部,反映出东部在数据基础设施完备度、数据资源开发深度、数据应用场景丰富度等方面具有显著优势,数据要素发展的集聚效应突出;中部地区次之,西部地区峰值最低,凸显了东、中、西部在数据要素发展水平上的层级差异。在2013—2022年的时间跨度内,从核密度曲线的峰值变化来看,全国及三大区域的数据要素发展水平在持续提升,数据基础设施不断完善、数据资源开发能力逐步增强、数据应用场景持续拓展、数据生态环境日益优化。
-
从曲线中心点的移动方向分析,东部地区曲线中心点小幅度右移,意味着其数据要素发展水平在高位上仍稳步提升,在数据要素前沿领域持续突破,保持发展的领先性与集中性;中部地区曲线中心点明显右移,反映出中部在数据要素发展上增速较快;西部地区曲线中心点亦呈右移态势,说明在重庆、四川等数据要素发展先行区域的带动下,西部地区整体数据要素发展水平有所提升。
-
图7 区域数据要素发展水平核密度分布曲线
-
从曲线拖尾特征来看,东部地区拖尾“先长后短”,表明其内部不同城市、不同产业间的数据要素发展水平差距逐步缩小,发展的均衡性与协同性增强;中部地区拖尾小幅缩短,表明其内部数据要素发展的不均衡状况有所改善,协同效应逐步显现;西部地区拖尾未出现明显缩短趋势,这与区域内发展不均衡有关,重庆、四川等地凭借完善的数据中心、算力设施和数据流通交易平台,在数据基础设施建设上取得显著成效,但西部地区其他省份在基础设施建设方面相对滞后,导致内部数据要素发展水平差距未能有效缩小。
-
(四) 省域数据要素发展差异成因分析
-
结合前文分析,省域数据要素发展差异的形成是资源禀赋、政策环境、产业基础、技术创新等多重因素共同作用的结果。
-
(1)资源禀赋与经济基础:东部经济总量大、收入水平高,可投入更多资金建设数字基础设施;西部经济基础薄弱、财政有限,数字基建滞后、数据供给不足,形成起点差距。
-
(2)政策支持与制度环境:东部作为数字经济先行区,率先开展数据要素市场化试点、数字政府建设,政策支持力度大、制度创新活跃,为数据流通与价值转化提供良好环境;中西部政策落地滞后,数据治理体系不完善,制约数据要素高效发展。
-
(3)产业结构与市场需求:东部数字产业集聚,传统产业数字化转型快,数据要素市场需求旺盛,形成供需良性循环;中西部以传统产业为主,数字化程度低,应用场景匮乏,数据价值转化缺乏载体,发展动能不足。
-
(4)技术创新与人才储备:东部高校和科研机构密集,数字技术创新强、人才集聚,为数据开发应用提供支撑;中西部人才流失严重,技术研发薄弱,数据资源开发应用水平低,难以形成核心竞争力。
-
(5)空间关联与辐射效应:东部核心区域通过集聚形成强辐射效应,带动周边发展;西部地理位置偏远,受核心区域辐射弱,且缺乏增长极带动,数据要素发展难以形成规模效应,进一步拉大与东部差距。
-
五、 结论与建议
-
本研究基于2011—2023年我国30个省份的面板数据,系统评估了省域数据要素发展水平,并深入剖析其时空演变特征及差异来源,得出如下结论。第一,我国数据要素发展水平整体持续提升,地区间差距呈波动收窄趋势。东部地区始终处于领先地位,部分中西部省份依托后发优势实现快速追赶,形成梯度发展格局。第二,空间分布具有“东强西弱、梯度递减”的特征,并存在显著的空间集聚效应。东部地区形成长三角、京津冀、珠三角三大高水平核心聚集区,中部及西南部分省份受辐射带动发展水平稳步提升,西部地区则以低水平集聚为主。第三,区域间差异是总体差异的主要来源,尤其以“东—西”差距最为显著;区域内差异呈现西部差异最大、中部次之、东部最小的层级特征,且东、中部内部差异逐步收敛,西部则持续高位波动。第四,省域数据要素发展差异是资源禀赋、政策环境、产业基础、技术创新与空间关联效应等多重因素交织作用的结果,共同塑造了当前的区域发展格局。基于上述研究结论,本文提出如下政策建议。
-
(1)聚焦区域间均衡,强化跨区域协同发展机制。针对“东—西”区域间的核心差距,建立东部与西部省份的结对帮扶机制,推动东部数据企业向西部布局。依托长江经济带、京津冀协同发展等国家重大区域战略,搭建跨区域数据要素流通共享平台,促进数据资源在东中西部间的有序流动。加大对西部地区数据基础设施的政策与资金倾斜,重点支持数字基础薄弱省份的算力中心、数据流通平台建设,缩小区域间发展的硬件差距。同时,优化中西部地区人才政策,吸引并留住数字人才,弥补人才短板。
-
(2)优化区域内治理,实施差异化精准施策。对于西部地区,重点缩小内部发展差距,支持重庆、四川等发展较好的省份发挥辐射带动作用,推动区域内数据资源共享与产业协同;针对青海、新疆等省份的基础设施短板与人才缺口问题,鼓励发展特色数字产业,培育本地数据应用场景。对于中部地区,应巩固其相对均衡的发展势头,深化数据要素与本地产业的融合应用,提升发展质量与稳定性。对于东部地区,则需发挥内部均衡发展优势,打造数据要素创新策源地,聚焦前沿技术研发与高端场景应用,同时加强对区域内相对滞后省份的带动,持续保持领先地位。
-
(3)完善制度保障体系,夯实协调发展基础。建立全国统一的数据要素发展评价与监测机制,动态跟踪各省域发展动态与差异变化。健全数据要素市场化配置制度,破除区域数据壁垒,规范数据交易秩序,降低跨区域数据流通成本。针对不同区域的发展阶段与资源禀赋实施差异化政策。同时,强化数据治理能力建设,完善数据产权保护、数据安全等相关法律法规,为数据要素协调发展提供坚实的制度保障。
-
(4)强化空间关联效应,构建梯度发展格局。充分发挥东部三大核心聚集区的辐射带动作用,推动数据要素向周边省份梯度扩散,形成“核心区引领—辐射区承接—潜力区培育”的空间发展格局。中部地区应主动承接东部产业转移,加强与东部核心区的合作,提升数据要素价值转化能力。西部地区则可依托自身资源优势,与东部地区形成数据要素互补发展模式,最终实现区域间优势互补与协同发展。
-
参考文献
-
[1] 中国信息通信研究院政策与经济研究所.数据价值化与数据要素市场发展报告(2021)[R/OL].2021-05.https://www.dgworkshop.cn/Public/data/info/fujian/hangye/222.pdf?eqid=d38dd5530000847c000000036466ebc6.
-
[2] 马建堂.建设高标准市场体系与构建新发展格局[J].管理世界,2021,37(5):1-10.
-
[3] 陈兵.数据要素市场化配置的法治推进——兼论《数据二十条》相关条款设计[J].上海大学学报(社会科学版),2024,41(1):1-13.
-
[4] 蔡跃洲,马文君.数据要素对高质量发展影响与数据流动制约[J].数量经济技术经济研究,2021,38(3):64-83.
-
[5] 马涛,刘秉源.跨境数据流动、数据要素价值化与全球数字贸易治理[J].国际经济评论,2024(2):151-176.
-
[6] 王开科,何强.基于价值增值视角的数据要素资本化核算研究[J].统计研究,2025,42(3):16-31.
-
[7] 欧阳日辉,龚伟.基于价值和市场评价贡献的数据要素定价机制[J].改革,2022(3):39-54.
-
[8] 许宪春,雷泽坤,胡亚茹.中国数据资本形成总额与数据资本存量测算[J].经济研究,2025,60(3):54-68.
-
[9] 张虎,刘宇笛.中国要素市场化配置水平的动态演进、结构差异与收敛性研究[J].经济问题探索,2022(11):19-37.
-
[10] 刘五星,朱险峰,王延培,等.数据要素市场发展指数及价格指数构建研究[J].价格理论与实践,2024(1):54-60.
-
[11] Tao C Q,Yi M Y,Wang C S.Coupling Coordination Analysis and Spatiotemporal Heterogeneity between Data Elements and Green Development in China[J].Economic Analysis and Policy,2023,77:1-15.
-
[12] Faroukhi A Z,El Alaoui I,Gahi Y,et al.Big Data Monetization Throughout Big Data Value Chain:A Comprehensive Review[J].Journal of Big Data,2020,7(1):1-22.
-
[13] Curry E.The Big Data Value Chain:Definitions,Concepts,and Theoretical Approaches[M]//Cavanillas J,Curry E,Wahlster W.New Horizons for a Date-Driven Economy.Springer Berlin/Heidelberg,2015:29-37.
-
[14] 陶长琪,丁煜.数据要素何以成为创新红利?——源于人力资本匹配的证据[J].中国软科学,2022(5):45-56.
-
[15] 王家明,冯连勇,李波,等.数据要素市场化配置效率的区域差异、动态演进与收敛性[J].统计与决策,2023,39(10):143-148.
-
[16] 杜传忠,曹效喜,刘书彤.数据要素市场化与地区绿色低碳发展——来自数据交易平台建设的准自然实验[J].经济与管理研究,2025,46(4):25-44.
-
[17] Yan H R,Zhao Z Y,Zheng Y H,et al.Evaluating the Energy-saving and Efficiency-enhancing Potential of Data Factor Marketization:Empirical Evidence from 270 Cities in China[J].Journal of Environmental Management,2025,378:124686.
-
[18] 潘宏亮,赵兰香,叶璐.我国数据要素发展水平的测度及时空演进研究[J].科学学研究,2025,43(1):205-216.
-
[19] Lefebvre H.The Production of Space[M].Oxford UK & Cambridge USA:Blackwell,1991:13-40.
-
[20] 赵驰,李浩,耿敏.数据确权、规模差异与平台跨界成长[J].经济学报,2024,11(3):394-431.
-
[21] 丁波涛.数据基础设施语境下的情报基础设施建设:概念、价值和任务[J].图书情报知识,2025,42(3):99-104.
-
[22] 左鹏飞,姜奇平,陈静.互联网发展、城镇化与我国产业结构转型升级[J].数量经济技术经济研究,2020,37(7):71-91.
-
[23] Qi P,Sun D,Xu C,et al.Can Data Elements Promote the High-Quality Development of China's Economy?[J].Sustainability,2023,15(9):7287.
-
[24] 赵放,蒋国梁,马婉莹.数据要素市场赋能数字产业创新——来自准自然实验的证据[J].经济评论,2024(3):109-125.
-
[25] 卢现祥,王素素.中国要素市场化配置水平的南北差异及形成机理[J].数量经济技术经济研究,2021,38(11):21-42.
-
[26] 柴士改,李金昌.中国经济增长新动能统计测度研究[J].统计与信息论坛,2021,36(1):47-58.
-
[27] 吕伊姝,王孝松.数据产权与数据价值市场化配置研究[J].经济学家,2024(6):76-85.
-
[28] Hagiu A,Wright J.Data-enabled Learning,Network Effects,and Competitive Advantage[J].The RAND Journal of Economics,2023,54(4):638-667.
-
[29] Berberi I,Roche D G.Reply to:Recognizing and Marshalling the Pre-publication Error Correction Potential of Open Data for More Reproducible Science[J].Nature Ecology Evolution,2023,7(10):1595-1596.
-
[30] 王军,朱杰,罗茜.中国数字经济发展水平及演变测度[J].数量经济技术经济研究,2021,38(7):26-42.
-
[31] 程广斌,李莹.基于投入产出视角的数字经济发展水平区域差异及效率评价[J].统计与决策,2022,38(8):109-113.
-
[32] Dagum C.A New Approach to the Decomposition of the Gini Income Inequality Ratio[J].Empirical Economics,1997,22(4):515-531.
-
[33] 沈小波,陈语,林伯强.技术进步和产业结构扭曲对中国能源强度的影响[J].经济研究,2021,56(2):157-173.
-
摘要
作为数字经济时代的核心生产要素,数据要素在省域层面的发展水平及其时空演化特征,直接影响全国数字经济协调发展的整体进程。基于2011—2023年我国30个省份的面板数据,从基础配置、价值转化、行业渗透、标准管理4个核心维度切入,构建省域数据要素发展水平评价指标体系,并运用核密度估计、Dagum基尼系数分解及空间分析等方法,系统探究省域数据要素发展水平的差异来源与演进特征。研究发现:我国数据要素发展水平总体呈持续上升态势,整体差距呈波动下降的收敛特征;差异来源方面,区域间差异为总体差异的首要贡献者,其中“东部—西部”差距最为显著,区域内差异呈现西部地区差异最大、中部次之、东部最小的分布格局;在空间分布上,呈现“东强西弱、梯度递减”的格局。
Abstract
As a core production factor in the digital economy era, the development level of data elements at the provincial level and its spatiotemporal evolution characteristics directly influence the overall process of coordinated development of the national digital economy. Based on panel data from 30 provinces in China from 2011 to 2023, this study constructs an evaluation index system for the development level of provincial data elements from four core dimensions: infrastructure configuration, value transformation, industry penetration, standard management. Employing methods such as kernel density estimation, Dagum Gini coefficient decomposition, and spatial analysis, it systematically investigates the sources of disparities and evolutionary characteristics in the development level of provincial data elements. The findings reveal that the overall development level of data elements in China exhibits a sustained upward trend, with the overall disparity showing a fluctuating yet convergent decline. Regarding the sources of disparity, inter-regional differences are the primary contributor to the overall disparity, with the "eastern-western" gap being the most significant. Intra-regional disparities are characterized by the western region exhibiting the largest disparity, followed by the central region, while the eastern region shows the smallest. In terms of spatial distribution, a pattern of "strong in the east, weak in the west, with a gradient decline" is observed.

