科研动态

国家天文台研究团队发布 SpecCLIP 模型:AI破译恒星光谱密码 助力银河系考古

发布时间:2026-02-24

在人工智能大模型迅速发展的今天,天文学也正在迎来一场新的技术变革。近日,由中国科研团队主导完成的研究成果 SpecCLIP人工智能模型正式发表,该工作将类似“大语言模型”的思想引入恒星光谱分析,为跨巡天数据融合和精密恒星物理参数研究提供了全新的思路。该成果也是我国团队在“天文基础模型”研究方向上的一次重要突破。

恒星光谱被称为研究宇宙的“指纹”。通过分析光谱中的谱线特征,科学家可以测量恒星的温度、重力加速度以及化学成分,并依据其记录的化学印记,像考古学一样反演银河系的演化历史。然而,不同望远镜和巡天项目获取的光谱数据往往存在分辨率、波段范围和观测方式上的差异,使得数据难以直接统一分析。

此次研究团队研发的 SpecCLIP 模型,重点用于解决LAMOST低分辨率光谱数据与Gaia XP光谱数据的联合分析问题。研究团队将不同来源的光谱数据映射到同一个“特征空间”,就像把不同语言翻译成同一种通用语法。通过对比学习方法,SpecCLIP模型能够自动学习两类光谱之间的内在联系,高效实现跨仪器、跨巡天的数据对齐与转换,为大规模联合研究提供了新的技术路径。

与传统针对单一任务训练的模型不同,SpecCLIP更接近一种“基础模型”框架。它不仅能够统一预测恒星大气参数和元素丰度,还可以开展光谱相似性搜索和异常源发现,为未来海量巡天数据的自动化分析奠定基础。特别是在银河系考古研究中,该模型可以助力极端贫金属星的大规模搜寻与证认,并推动前所未有的大规模外晕红巨星样本的构建,为追溯银河系早期并合历史提供关键的观测数据基础。

基于这种统一表征能力,SpecCLIP模型已开始服务多项前沿科学方向。例如,在Earth 2.0(ET)任务的科学准备中,SpecCLIP模型能够为 ET 天区的行星寄主恒星提供准确而全面的基础参数,从而提升潜在宜居行星的筛选效率;在银河系演化史研究方面,该模型为数百万恒星年龄的统一测量提供了新的技术路径,并为重建银河系形成与并合历史带来了更大规模的数据基础。

随着 LAMOST、Gaia 以及下一代巡天项目持续产生海量观测数据,天文学正从“单一任务模型”时代逐步迈向“基础模型“时代。研究人员表示,SpecCLIP 模型展示了人工智能方法在天文光谱研究领域的潜力,有望成为连接不同观测系统的重要桥梁,并推动银河系结构和形成演化研究以及恒星物理研究迈向更高精度。

图1:基于 SpecCLIP 基座模型构建的面向科研人员的恒星光谱专业分析平台界面(https://digital-galaxy.zero2x.org.cn/)。在该平台上,用户可上传类LAMOST光谱数据,以类似ChatGPT的对话方式开展参数测量,并联动AI完成相关文献的检索、整理与辅助分析。

图2:SpecCLIP 大模型示意图

 近日,本工作在《天体物理学报》(ApJ)上正式发表(文章链接:https://doi.org/10.3847/1538-4357/ae2c7e)。中国科学院大学赵晓胜博士(现为约翰霍普金斯大学博士后)、国家天文台孔啸博士与之江实验室薛贵荣博士为文章共同第一作者,中国科学院大学黄样博士为通讯作者。本工作得到了国家自然科学基金委青年基金B类(原优青)资助。

本工作为国家天文台与之江实验室共同发起的天文领域基础模型系列工作的第二篇。此前,由国家天文台、国家天文科学数据中心陶一寒博士等领衔的合作团队,面向时域光变数据构建的基座模型 FALCO 已于今年在《天文学杂志》(AJ)发表(文章链接:https://iopscience.iop.org/article/10.3847/1538-3881/ae1467

相关工作的持续推进与成果发布,标志着由国家天文台与之江实验室联合发起的天文基础模型研究,正在人工智能新范式下迈出具有探索意义的重要一步。


附件下载: