金矿、铜矿、煤矿……地球上各种矿产都可以精确称呼。数据,已被定义为继土地、劳动力、资本、技术之后的第五大生产要素,常常被比喻为新型“矿产”。但是,没有哪个机构能够简单地说明自己拥有的是什么类型的“数据矿产”。上海市城市设计与城市科学重点实验室10月25日发布了最新研究成果《从“数据元素周期表”到“数据反应”——理论创新助力数据要素资产化探索》。
随着全球数字经济进程加快,如何充分释放数据要素的巨大潜能,成为一个亟待解决的命题。2023年9月,在上海举办的“2023数字经济峰会”上,人民网、传播内容认知全国重点实验室负责人首次公开宣布,人民数据研究院(人民数据旗下的数字经济智库平台)将携手多方力量,参考物理世界的化学元素周期表,研发一个能够超出行业或地域限制,对数据进行精确表达、并推演不同数据之间“化学反应”的基础理论框架。随后,上海市城市设计与城市科学重点实验室作为国际化的领先团队,加入了这一联合研究计划。
上海市城市设计与城市科学重点实验室执行副主任刘艳军表示,要真正释放数据的潜能,就必须实现从“大数据应用”到“数据要素应用”的根本转变。不能仅仅停留在数据的收集和简单分析上,而是要深入挖掘数据的内在价值,将其转化为能够驱动经济社会发展的核心资源。同时,数据也需要从“资源”向“资产”升级,从内部封闭使用转变为共享协同使用,让数据流动起来,产生更大的社会效益和经济效益。
当前,数据转化存在数据质量参差不齐、数据孤岛现象常见、应用场景不明确等问题,成为制约数据要素释放潜能的“绊脚石”。刘艳军认为,人民网提出的数据元素周期表,为数据的系统化分析和应用开辟了一条新路径。
数据元素周期表,顾名思义,就是将数据要素按照一定规律拆解为更基础、更易于理解和操作的数据元素。基于数据元素周期表设想,人民数据积极探索“数据元素标识体系”,对数据地域、行业、体量、时间、质量、更新频次等特征进行标注,通过数据或字母清晰地界定数据资源特征,形成唯一且能快速识别数据身份的“身份码”。基于上述规则,人民数据研发形成了国内首个数据要素编码体系,可以让数据持码流通。这是数据元素周期表研发的第一阶段成果。
在清晰标识数据元素基础上,可进一步进行“数据反应”分析。刘艳军介绍,这些元素就像化学元素周期表中的原子一样,通过不同的组合和反应,能够生成各种复杂的数据结构和应用场景。通过对数据元素的清晰标识和“数据反应”分析,我们可以将原本零散、无序的数据资源,按照特定的处理模式进行加工和计算,最终生成具有实际应用价值的数据要素场景。
今年8月,人民数据、上海市城市设计与城市科学重点实验室携手,推出了《上海数据元素周期图谱——数据“反应”分析报告》。这份报告以某市人口数据和商业网点数据为例,展示了如何通过集成这两类数据,优化商业布局,提升居民消费便利性,进而促进区域经济的均衡增长。
通过数据分析预测消费趋势,智能规划商业网点布局,不仅增加了就业机会,还显著提升了商业活动的效率。报告输出的数据成果包括未来三年各区域人口消费潜力预测图、商业网点优化布局建议书,以及新增就业机会与经济效益评估报告,为政府和企业提供了科学决策的依据。
数据的价值并不仅仅在于其数量,更在于其能够产生的应用场景以及这些场景的实用性和落地性。为了评估数据在不同场景下的反应效果,上海市城市设计与城市科学重点实验室联合有关单位,利用多模态人工智能大模型技术,打造了数据探针模型——“Ailoud数据指南针”。这是基于数据元素周期表研发的第一款“数据反应”实用工具软件。
“简单来理解,如果将物质世界的化学反应比作氧气和氢气在加热条件下生成水的过程,那么在数字空间中,氧气和氢气就是我们的数据元素,而加热的条件则是‘数据反应’。”刘艳军表示,“数据反应”可以辅助生成各种所需的数据要素场景,“Ailoud数据指南针”则像是实验室中的精密仪器,能够帮助我们准确评估这些场景的经济效益、创新性、实用性。
“随着数据元素周期表和数据指南针等创新工具的不断涌现,数据不再是冷冰冰的数字和符号,而是能够驱动经济社会发展的强大动力。”刘艳军表示,数据具有乘数效应,能够创造规模经济和范围经济,提升配置效率和激励效率。充分发挥数据要素作用,是做强做优做大数字经济,赋能实体经济的必然要求。
上述重要成果是在人民日报社主办,人民网、人民日报数字传播有限公司承办的2024媒体融合发展论坛“数据驱动创新智媒业态”平行论坛发布的,与会嘉宾进行了深入研讨。