科研图表是承载实验数据和科学结论的重要载体,海量学术文献中的散点图、柱状图蕴含着丰富的原始实验数据。传统数据提取工具多依赖人工交互,现有自动化技术仍停留在图表元素识别阶段,难以实现高精度的数据获取。
近期,中国科学院计算机网络信息中心研发出科研图表智能解析深度学习框架ChartRecover,实现从科研图表图像到结构化科学数据的自动化提取与高精度重构。研究团队提出刻度线—刻度值对齐算法,实现坐标轴语义信息与空间位置的精准匹配。在国际权威评测数据集上的测试结果表明,ChatRecover在图表元素检测和真实数据恢复任务中均达到国际先进水平。
该成果为科研文献中海量“沉睡数据”的自动挖掘提供了重要技术支撑,可广泛应用于科研数据汇聚、知识图谱构建、科学数据库建设及AI for Science等应用场景。
相关研究成果发表在Communications Engineering上。研究工作得到国家重点研发计划、中国科学院战略性先导科技专项等的支持。(来源:中国科学院计算机网络信息中心)
相关论文信息:https://doi.org/10.1038/s44172-026-00691-8
特别声明:本文转载仅仅是出于传播信息的需要,并不意味着代表本网站观点或证实其内容的真实性;如其他媒体、网站或个人从本网站转载使用,须保留本网站注明的“来源”,并自负版权等法律责任;作者如果不希望被转载或者联系转载稿费等事宜,请与我们接洽。