国内首个全国产化千亿参数细粒度MoE语义大模型开源—新闻

作者：李惠钰来源：中国科学报发布时间：2025/12/26 18:39:22

选择字号：小中大

国内首个全国产化千亿参数细粒度MoE语义大模型开源

近日，中电信人工智能科技有限公司和中国电信人工智能研究院（TeleAI）的星辰语义大模型研发团队宣布，国内首个全国产化训练的千亿参数细粒度MoE语义大模型TeleChat3-105B-A4.7-Thinking正式开源。

该模型采用细粒度MoE 架构，基础模型训练数据超 15T，共包括 1 个共享专家和 192 个路由专家（每次激活 4 个专家），模型整体共 105B 参数量，实际激活参数为 4.7B，专家稀疏比处于业界前列。在IFEval、Math-500、AIME2025、Tau2-Bench等十多个权威评测集上，效果对标GPT-OSS-120B、Qwen3-30B-A3B、Qwen3-32B等模型。

面对综合任务场景，TeleChat3-105B-A4.7-Thinking可高效拆解任务需求，整合多项代码能力，一次性交付出完整可运行的代码，实现代码补全、代码修改、网站和网页游戏生成等多类任务，省去大量人工调试时间投入，运行流畅，结果准确。

此外，团队还同步开源了稠密参数模型 TeleChat3-36B-Thinking ，在知识问答、逻辑推理、智能体等维度实现了能力提升，并实现了文本创作、语义理解、角色扮演等任务的针对性优化。

据了解，此前中电信人工智能科技有限公司和中国电信人工智能研究院（TeleAI）已陆续开源自研的TeleChat、TeleChat2 及 TeleChat2.5 系列模型，以传统稠密参数架构为主，模型尺寸覆盖十亿到千亿，构建了全尺寸大模型的开源布局。

相关论文

图片新闻



>>更多

一周新闻排行

编辑部推荐博文

国自然基金，这项优化让你的申请书更“吸睛”！

科学网2026年1月十佳博文榜单公布！

媒体报道集锦 | 2025年11月文章推荐

三维晶体，生命密码——给蛋白质拍“X光片”的梁栋材院士

植物认知新范式：拓展性认知重构植物认知二元论

哈尔滨理工大学魏博鑫/哈尔滨工业大学王玉金等：通过两步反应烧结原位 ...

更多>>