作者:高雅丽 来源:中国科学报 发布时间:2024/9/21 19:15:25
选择字号:
首个!百亿级遥感解译基础模型“空天·灵眸”发布

 

9月21日,在第一届空天信息技术大会上,中国科学院空天信息创新研究院(空天院)研究员付琨团队联合鹏城实验室,正式发布自主研制的百亿级遥感解译基础模型——“空天·灵眸”3.0版,这是迄今为止全球首个百亿参数级空天一体遥感解译基础模型。

近年来,我国遥感数据获取能力不断增强,已进入遥感大数据时代,人工智能等新型数据处理方式也为数据服务模式的变革提供了可能。“空天·灵眸”是我国首个面向多模态遥感数据生成式基础模型,也是首个专为遥感领域打造的行业基础模型。自2022年首次推出后,空天院研究团队在“基础模型+下游任务”计算范式积累上持续探索。今年3月起,研究团队与鹏城实验室深度合作,基于中国算力网“鹏城云脑II”枢纽节点,采用512张昇腾910显卡,历时数月攻关完成了在4亿张国产化多模态空天遥感数据样本上的预训练,基础模型参数规模首次超过百亿。

中国科学院空天院研究员孙显表示,如果把基础模型看作是一个机器人,那么“参数”就相当于它的“记忆细胞”和“知识细胞”。“如果参数规模小,则它能记住和处理的信息就相对有限,只能做一些比较简单的任务。参数规模越大,这两种细胞就越多,它就能捕捉、记忆和处理更复杂的信息,从而更加准确、精细地完成更困难、更复杂的任务。”孙显说。

“空天·灵眸”3.0版内核工作架构是基于热传导,这是联合团队自主研发的一套小而精的原创性架构。受传热学物理思想启发,联合团队将场景目标间视觉语义传播建模为热能扩散过程,从而使该架构有效突破了遥感模型推理的性能和速度瓶颈,计算速度较传统结构模型提升2.4倍以上。

孙显说:“‘热传导’的架构,吸收了物理的传热学原理。联合团队将模型运行与热传导作类比,将图像也看作一个温度场,重要的图像区域应该保持较高的温度,用热传导的计算公式来指导和推动模型进行学习。这一架构实现了模型数据学习、推理等速度的大幅提升。例如,原来训练1千万张数据样本,需要大约300多块显卡,现在不仅只需要三分之一的数量,处理速度还能提升约2.4倍。

“空天·灵眸”3.0版目前已表现出极为优秀的泛化解译性能,在可见光、合成孔径雷达、热红外、多光谱等多传感器卫星数据基础上,拓展至航空遥感飞机、无人机等不同航空平台观测数据的自动化、高精度解译处理。尤其是航空大倾角成像过程中,极易出现畸变、遮挡、缺失等干扰,模型对此依然可以保持高精度的识别能力。

目前“空天·灵眸”3.0版在覆盖场景分类、目标检测、语义分割、变化检测等6大类任务的23个国际基准数据集上测试,较比当前的主流模型,精度平均提升4%至10%,指标均达到领先水平,并已在应急、国土、海洋、住建等多个行业部署试运行,特别是在最具挑战性的复杂要素精细分类、运动小目标连续跟踪等任务上性能卓越,为天临空地一体化应用提供了一套行之有效的解决方案。未来,研究团队将持续推动“空天·灵眸”3.0版在国民经济各个行业的落地应用。

 
版权声明:凡本网注明“来源:中国科学报、科学网、科学新闻杂志”的所有作品,网站转载,请在正文上方注明来源和作者,且不得对内容作实质性改动;微信公众号、头条号等新媒体平台,转载请联系授权。邮箱:shouquan@stimes.cn。
 
 打印  发E-mail给: 
    
 
相关新闻 相关论文

图片新闻
科学网APP论文&基金最新活动来了 他们的15年“铸剑”之路
星链卫星让射电望远镜“失明” 研究生学位论文开题的十大注意事项
>>更多
 
一周新闻排行
 
编辑部推荐博文