在人工智能大模型迅速发展的今天,天文学也正在迎来一场新的技术变革。近日,由中国科研团队主导完成的研究成果SpecCLIP人工智能模型正式发表,该工作将类似“大语言模型”的思想引入恒星光谱分析,为跨巡天数据融合和精密恒星物理参数研究提供了全新的思路。相关工作日前在《天体物理学报》发表。
恒星光谱被称为研究宇宙的“指纹”。通过分析光谱中的谱线特征,科学家可以测量恒星的温度、重力加速度以及化学成分,并依据其记录的化学印记,像考古学一样反演银河系的演化历史。然而,不同望远镜和巡天项目获取的光谱数据往往存在分辨率、波段范围和观测方式上的差异,使得数据难以直接统一分析。
此次研究团队研发的SpecCLIP模型重点用于解决郭守敬望远镜(LAMOST)低分辨率光谱数据与Gaia XP光谱数据的联合分析问题。研究团队将不同来源的光谱数据映射到同一个“特征空间”,就像把不同语言翻译成同一种通用语法。通过对比学习方法,SpecCLIP模型能够自动学习两类光谱之间的内在联系,高效实现跨仪器、跨巡天的数据对齐与转换,为大规模联合研究提供了新的技术路径。
与传统针对单一任务训练的模型不同,SpecCLIP更接近一种“基础模型”框架。它不仅能够统一预测恒星大气参数和元素丰度,还可以开展光谱相似性搜索和异常源发现,为未来海量巡天数据的自动化分析奠定基础。
科研人员认为,特别是在银河系考古研究中,该模型可以助力极端贫金属星的大规模搜寻与证认,并推动前所未有的大规模外晕红巨星样本的构建,为追溯银河系早期并合历史提供关键的观测数据基础。
基于这种统一表征能力,SpecCLIP模型已开始服务多项前沿科学方向。例如,在Earth 2.0(ET)任务的科学准备中,SpecCLIP模型能够为 ET 天区的行星寄主恒星提供准确而全面的基础参数,从而提升潜在宜居行星的筛选效率;在银河系演化史研究方面,该模型为数百万恒星年龄的统一测量提供了新的技术路径,并为重建银河系形成与并合历史带来了更大规模的数据基础。
随着LAMOST、Gaia以及下一代巡天项目持续产生海量观测数据,天文学正从“单一任务模型”时代逐步迈向“基础模型“时代。研究人员表示,SpecCLIP 模型展示了人工智能方法在天文光谱研究领域的潜力,有望成为连接不同观测系统的重要桥梁,并推动银河系结构和形成演化研究以及恒星物理研究迈向更高精度。
SpecCLIP大模型示意图。科研团队供图
中国科学院大学赵晓胜博士(现为约翰霍普金斯大学博士后)、中国科学院国家天文台孔啸博士与之江实验室薛贵荣博士为文章共同第一作者,中国科学院大学黄样博士为通讯作者。
据了解,本研究为国家天文台与之江实验室共同发起的天文领域基础模型系列工作之一。此前,相关科研团队发布了面向时域光变数据构建的基座模型FALCO。
相关论文信息:https://doi.org/10.3847/1538-4357/ae2c7e
版权声明:凡本网注明“来源:中国科学报、科学网、科学新闻杂志”的所有作品,网站转载,请在正文上方注明来源和作者,且不得对内容作实质性改动;微信公众号、头条号等新媒体平台,转载请联系授权。邮箱:shouquan@stimes.cn。