2025年底,国家数据局将2026年明确定位为“数据要素价值释放年”。3月5日,《政府工作报告》进一步强调,要深化数据资源开发利用,健全数据要素基础制度,建设高质量数据集。
在此背景下,如何筑牢数字“底座”,成为两会代表委员们热议的焦点。《中国科学报》采访了多位代表委员与一线科学家,他们从交通强国建设中的“血液”,到驱动生命科学创新的“引擎”,再到为算力定价、存储短板及人才困境建言献策,对数字中国建设提出一系列真知灼见。
畅通数据“血液”循环
为交通强国建设注入新动能
在现代经济活动中,数据无处不在。“从汽车、无人机、机器人等现代装备上遍布的传感器感知数据,到机器设备自身的运转数据,再到运转调度、指挥、服务与生产作业的运营数据,千行百业的全生命周期都在产生海量数据。”全国政协委员、北京交通大学教授钟章队在接受《中国科学报》采访时说。
“数据就像数字经济时代的‘血液’,它通过通信网络的‘血管’进行传输,由云计算和算力网络进行‘心脏’泵送和处理,最终由AI作为‘大脑’进行深度加工,支撑起各类智能应用。”钟章队形象地比喻说,在交通领域,数据要素的流动与应用,是驱动其从传统运输业向数字化、智能化、绿色化现代综合交通体系转型的关键。
“它让运输组织更‘聪明’,服务体验更‘优质’,安全保障更‘可靠’。”钟章队说。依托大数据,高铁、高速公路等复杂大网络可以实现精准调度、动态调整和智能预警。通过分析客流、货流和天气等实时数据,系统可以智能选择最优路线,大幅提升路网的通行能力和正点率。
他举例说,以铁路12306为代表的客票系统,通过对客流数据的精准采集与分析,实现列车开行方案的动态调整、运力的精准投放。通过身份证件、电子客票、刷脸进站、在线退改签等服务,让“数据多跑路,群众少跑腿”,极大减少了旅客候车与排队时间。而95306货运平台则打通了货流、车流、信息流、资金流的全链条数据,实现了货物从“站到站”向“门到门”“端到端”的转变,提供了全程可追溯的现代物流服务。
此外,通过对动车组、线路、信号等设备全生命周期的数据监控,可以实现装备故障的预判、运营风险的预警和事后的精准维护。这种从事中监管、事后分析到事前预防的闭环,构建了更加可靠的安全屏障。
“从这些方面来看,数据要素都已经成为智能铁路、智慧交通的‘硬核’支撑。”钟章队说。
尽管成绩斐然,钟章队也坦诚,当前数据要素在交通领域的深化应用仍面临“堵点”。由于铁路、公路、民航、水运分属不同部门管理带来的行政壁垒,导致跨部门、跨区域、跨方式的数据共享难,“一票制”联程联运目前仍难以实现。由于数据标准尚不统一,由于不同厂家、不同系统的设备、运营、服务数据来源多样,接口、格式、口径不一,导致数据难以深度融通和挖掘分析。同时,由于市场化流通机制有待健全,数据的确权、交易、收益分配及安全责任归属等机制尚不清晰,制约了数据价值的释放。此外,安全与共享尚需进一步平衡,部分单位对数据使用和公开存在“不敢共享、不会共享”的顾虑,如何在确保安全的前提下促进数据开放,是亟待解决的问题。
谈及人工智能(AI)与交通的融合,钟章队表示,“数据血液质量越高,AI这个‘大脑’才能越聪明。”他表示,人工智能的深度应用,必须以高质量的数据治理和开放共享为前提。目前,在交通领域,面向公众的To C端地图导航等应用已较为成熟,但面向行业生产、调度、安全的To B端的应用才刚刚起步。
“未来,我们需要在通用大模型的基础上,结合行业特有的‘行话’和规律,开发出适宜的大模型。”
钟章队展望,随着数据要素市场的不断完善和人工智能场景的深度培育,交通领域的智能化变革将迎来新一轮的爆发式增长,为建设“人享其行、物畅其流”的交通强国注入源源不断的数智动能。
驱动数字“新石油”
成为生命科学创新“核心引擎”
作为国家微生物科学数据中心主任,马俊才见证了数据要素在本领域的巨大价值。他介绍道,该中心建立的微生物数据平台,目前已覆盖全球超8PB数据量,汇聚了60多亿条微生物数据资源。这一庞大的数据库支撑了新药研发、疫情预警、生物制造等重大应用场景,并入选国家数据局首批18个国家层面公共示范应用场景。
“我们致力于通过数据流通打破‘信息孤岛’,让数据成为生命科学创新的‘核心引擎’。”同时担任中国科学院微生物研究所研究员的马俊才在接受《中国科学报》采访时说。
在马俊才看来,数据要素就像数字经济的“新石油”。它不仅能驱动技术创新、优化资源配置,还能加速产业升级。结合过往实践,他表示,该中心正在开展的国家数据局“基于自主生物制造数据的氨基酸高产菌株改造示范场景建设”应用项目,就是以社会效益和产业自主为导向,通过构建生物制造科学数据共享平台,整合多源异构数据形成高质量数据集。在此基础上,通过人工智能模型开发,实现工业菌种优化,赋能生物制造。
据介绍,基于国家微生物科学数据中心的大数据挖掘和人工智能设计,科学家首创了普瑞巴林手性中间体R-单酰胺一步酶法合成技术,已转化落地国内多家企业,该工艺避免了有毒有机溶剂的使用,合成成本比传统化学拆分工艺下降50%,预计产值超亿元,为我国生物制造产业的可持续发展注入了强劲动力。
在回顾成绩的同时,马俊才也直言不讳地指出了当前制约数据发挥作用的体制机制堵点——标准不统一。他以合成生物学为例,尽管该领域在食品、医药、能源等方面发展迅猛,但研发、生产与监管环节的数据割裂严重阻碍了技术落地。
“尤其是在组学信息、生物过程参数与产品安全评价等关键环节,缺乏统一标准。”马俊才表示,这种全链条数据不互通的现状,已成为制约全球生物制造产业化的共性难题。
面对这一挑战,马俊才建议,一定要提升国际标准建设能力和话语权。基于依托中国科学院微生物研究所成立的世界微生物数据中心,2025年,马俊才与国内外同行倡导举办了“生物制造全链条标准化研讨会”,邀请了来自基因组信息学、生物技术、食品技术等27位国际标准化组织(ISO)的技术委员会主席和核心专家参会,有效推动了包括基因组信息学、分析方法、生物样本保藏、生物技术等11项ISO标准提案的研讨和立项工作。
“作为我国生命科学领域唯一的世界微生物中心,我们将继续凝聚全球共识。”马俊才表示,未来将继续致力于推动全球全链条数据的互通共享,全力打造具有世界影响力和引领力的微生物数据中心,为全球生物经济发展贡献中国智慧与中国力量。
筑牢数据“底座”
尚需全方位发力
两会期间,来自各界的代表委员还围绕数据治理、算力布局、存储技术及人才培养等核心议题,提出了诸多建设性意见。他们认为,如果将当下炙手可热的AI比作台前的“明星”,那么数据要素就是幕后的“底座”,数据治理就是决定AI下半场胜负的核心竞争力。
算力作为数据的“加工厂”,其供给结构和发展质量直接影响数据价值释放的效率。全国政协委员、中国科学院计算技术研究所研究员张云泉指出,当前算力市场化定价机制尚不完善。他建议参照电力的“基准价+上下浮动”模式,建立成本核算与价格指导体系,设立成本底线并引导错峰用电。同时,呼吁建立统一的算力度量标准,对通用计算、高性能计算、AI训练与推理分别制定标准化单位和等价换算规则,以规范市场运行。
“当前我国算力建设仍存在四大突出问题。”全国政协委员、北京国际城市发展研究院创始院长连玉明指出,包括供需错配,高端智能算力紧张与西部通用算力闲置并存;“算力孤岛”现象严重,跨域资源难以流通;网络时延削弱西部优势;“算电协同”水平不高。
对于算力建设的宏观布局,他建议优化“东数西算”战略布局,构建“国家—区域—边缘”三级算力架构,实施精准功能布局。同时,通过完善直连网络、健全市场机制和推动绿色转型,系统性解决这些问题。
数据的永久保存和高效读写是释放其价值的前提,全国人大代表、全国人大财政经济委员会委员骞芳莉指出,当前,我国存储核心产业存在明显短板:机械硬盘(HDD)产业完全空白,NAND闪存核心技术仍有差距,关键材料与设备对外依存度高。此外,国内存储基础设施建设全闪存化应用渗透率偏低。“这使得我国数据留存率仅为2.8%,‘应存未存’现象突出。”骞芳莉呼吁,在全球存储器件价格因供需失衡而暴涨之际,必须加快发展以固态硬盘(SSD)为代表的先进存力,补齐产业链短板,保障国家数据安全,掌握数字经济发展主动权。
数据价值的挖掘最终离不开人才,全国政协委员、南京大学副校长、中国科学院院士周志华在全国政协十四届四次会议第二次全体会议上作大会发言时认为,目前,部分科研工作者对“人工智能赋能科学研究”停留在对工具的简单套用,或盲目尝试训练通用“科学大模型”以应对所有问题。”
“要加强政策引导,提升基础创新能力。”周志华建议,优化人工智能领域科学研究的统筹布局,重点支持一批具有前瞻性、战略性的基础研究项目,鼓励科研人员开展原创性研究。同时,变革培养模式,打造复合型人才队伍,从源头构建“人工智能赋能科学研究”复合型创新人才培养体系,系统化培养既深谙领域知识又掌握前沿AI技术的“双语”科学家。同时,在学位获取、职称晋升、绩效考核等环节建立“交叉学科特区”,解决跨学科人才在传统评价体系中“两头不靠”的困境。
这些建议为夯实“数字中国”的前景不断添砖加瓦,也为我国人工智能的可持续发展注入了强劲动力。
版权声明:凡本网注明“来源:中国科学报、科学网、科学新闻杂志”的所有作品,网站转载,请在正文上方注明来源和作者,且不得对内容作实质性改动;微信公众号、头条号等新媒体平台,转载请联系授权。邮箱:shouquan@stimes.cn。