作者:田瑞颖 来源:中国科学报 发布时间:2025/9/26 20:57:42
选择字号:
高效推理模型LongCat-Flash-Thinking发布

 

近日,高效推理模型 LongCat-Flash-Thinking正式发布。该模型增强了智能体自主调用工具的能力,并扩展了形式化定理证明能力,成为同时具备“深度思考+工具调用”与“非形式化+形式化”推理能力相结合的大语言模型。

美团LongCat研发团队表示, LongCat-Flash-Thinking在高复杂度的任务,例如数学、代码、智能体任务等处理上具备显著优势,目前已在HuggingFace、Github全面开源。

为了解决强化学习领域混合训练的稳定性问题,研发团队设计了一种领域并行方案,将STEM、代码和智能体任务的优化过程解耦。这一方法采用了多领域并行训练再融合的先进策略,实现模型能力的均衡提升,综合性能达到帕累托最优。

此外,研发团队设计了全新的“双路径推理框架”以提升模型的智能体能力。该框架能够自主筛选最优查询样本,并通过自动化流程将智能体推理与工具使用相结合,使模型能够智能识别并调用外部工具(如代码执行器、API等),从而高效解决复杂任务。

为了克服当前开源通用大型语言模型在形式化证明任务中的不足,研发团队还针对形式化推理设计了一套全新的基于专家迭代框架的数据合成方法。该流程利用集成了 Lean4 服务器的专家迭代框架,生成经过严格验证的证明过程,从而系统性提升模型的形式化推理能力。这一创新方法系统性地增强了模型的形式化推理能力,提高了其在学术和工程应用中的可靠性。

 
版权声明:凡本网注明“来源:中国科学报、科学网、科学新闻杂志”的所有作品,网站转载,请在正文上方注明来源和作者,且不得对内容作实质性改动;微信公众号、头条号等新媒体平台,转载请联系授权。邮箱:shouquan@stimes.cn。
 
 打印  发E-mail给: 
    
 
相关新闻 相关论文

图片新闻
想要大脑更年轻?研究人员建议这样吃 “彩虹”工具库让细胞内部可视化
科学家在人类骨骼内部发现微塑料 首个由AI设计的病毒问世
>>更多
 
一周新闻排行
 
编辑部推荐博文