党的二十届三中全会深入分析推进中国式现代化面临的新情况新问题,强调“建设和运营国家数据基础设施,促进数据共享”“培育全国一体化技术和数据市场”。
数字基础设施建设是高质量发展的关键支撑、重要载体。调研发现,促进数据共享主要面临基建不完备、发展不平衡、供需不充分等三大瓶颈。
基建网络:一方面,数据采集汇聚标准、统筹管理不统一,“纵强横弱”特征明显。不同行业、不同类型数据整合互通互联操作性不佳。另一方面,有数据的地方就有存储,海量数据复用价值低、处理成本高;算力不足,产生的数据在源头处就遭弃用。
产业发展:数据链发展“头重脚轻”,资源未充分利用。2022年,中国数据要素市场规模达1018.8亿元。其中,数据交易(120亿元)、数据服务(85亿元)、生态保障(50亿元)等产业链下游还有提升空间。
市场表现:数据资源转化为数据要素并进入流通交易的比例偏低,在国内27家交易所上架的数据产品仅有17.9%实现交易;参与交易流通的企业,约87.67%购买数据、33.32%出售数据,整体呈现数据供不出、流不动的局面。
下一步,可从数据、算力、算法、数商生态以及营商环境等方面着手培育全国一体化数据市场,促进要素流动和数据共享。
一是数据底座:建立全国统一大数据平台。
新形势下,应在全国层面建立自主可控、分布式存储的统一标准数据底座,通过逻辑统一的存算标准联结各地超算中心。在此基础上,加强冷数据智能分级保护管理机制,为研发与利用提供随时抽取的大数据“饲料”,提高数据产存转化水平。
二是智算中心:助力“东数西算”战略。
智算中心是集算力、算法、数据、运营于一体的服务生态。面对能耗和成本控制问题,智算中心资源建设应更多布局在西部地区,以“去中心化”助力解决终端数据问题,疏解“东数西算”堵点,促进资源有效配置、区域协同发展。
三是算法基建:发挥头部创新优势。
人工智能(AI)大模型作为数据空间算法基础设施之一,是赋能千行百业、发挥“长尾效应”的关键力量。
新形势下,应注重发挥头部平台创新优势,提高数据赋能效率。比如,利用AI大模型有效解决数据采集标注成本高、质量低、单一性以及隐私安全等问题。
大语言模型训练需要较多的资源投入,可协调引导头部企业整合研发资源,避免无谓的资源试错,尽早促进“军团式”作战,发挥产业生态规模效应。
针对数据合规和隐私保障等问题,可适当超前布局算法基础设施,积极创新应用Web3.0、隐私计算、动态加密等技术,让数据权益得到清晰兑现。
四是数商生态:创新交易流通体系。
繁荣数据要素市场,推动数据流通共享,应充分发挥有为政府主体优势,完善数据产业生态。
在数据采汇端,政府部门、央企以及头部平台可率先建立统一数据汇聚体系,加快打造国家数据资源库;在流通交易端,可在相关行业开展平台和企业数据交易流通试点,并实现资产有序标准化。
要进一步发挥平台效应,创新C2B(分销模式)、B2B(数据平台集销模式)、B2B2C(数据经纪商分集混合模式)等交易方式,以数据为资产、银行为平台,推进个人数据交易流通等。
五是营商环境:强化监管保障机制。
优化由政策、法律、规则等构成的“软环境”,努力构建开放、公平、非歧视的数字营商环境,提高数字服务的共享流通及监管水平。
完善主要由市场供求关系决定要素价格机制,防止政府对价格形成的不当干预,构建亲清统一的新型政商关系。
(作者分别为上海交通大学中国城市治理研究院研究中心主任、安徽财经大学合肥研究院副教授)
(文章来源:解放日报)