DeepSeek-V3.2上线国家超算互联网—新闻

作者：赵广立来源：中国科学报发布时间：2025/9/30 14:31:25

选择字号：小中大

依托国产深算智能加速卡

DeepSeek-V3.2上线国家超算互联网

9月30日，依托国产深算智能加速卡以及全国一体化算力网，DeepSeek-V3.2-Exp上线国家超算互联网AI社区，企业和开发者均可在AI社区免费下载DeepSeek-V3.2-Exp模型文件进行快速开发。

9月29日，DeepSeek正式发布DeepSeek-V3.2-Exp模型，这是一个实验性（Experimental）的版本。作为迈向新一代架构的中间步骤，V3.2-Exp在V3.1-Terminus的基础上引入了DeepSeekSparseAttention（可简写作DSA，一种稀疏注意力机制），针对长文本的训练和推理效率进行了探索性的优化和验证。

据介绍，DSA首次实现了细粒度稀疏注意力机制，在几乎不影响模型输出效果的前提下，实现了长文本训练和推理效率的大幅提升。

目前，超算互联网AI社区已汇聚700余款国内外优质开源模型，包括DeepSeek-V3.1-Terminus、DeepSeek-R1-0528、DeepSeek-R1、DeepSeek-V3等DeepSeek系列，用户可登录超算互联网AI社区，实现API调用、Chatbot在线推理对话、国产大模型分布式训练、微调等功能于一体的MaaS服务。

相关论文

图片新闻



>>更多

一周新闻排行

编辑部推荐博文
国自然基金，这项优化让你的申请书更“吸睛”！科学网2026年1月十佳博文榜单公布！人文社科教育学SSCI，无版面费！国防科技大学邵长伟等最新论文同济大学施剑林院士、谢冬、唐忠敏等最新论文手把手教您写出“一眼抓住编辑”的Introduction 更多>>