作者:赵广立 来源:中国科学报 发布时间:2025/9/30 14:31:25
选择字号:
依托国产深算智能加速卡
DeepSeek-V3.2上线国家超算互联网

 

9月30日,依托国产深算智能加速卡以及全国一体化算力网,DeepSeek-V3.2-Exp上线国家超算互联网AI社区,企业和开发者均可在AI社区免费下载DeepSeek-V3.2-Exp模型文件进行快速开发。

9月29日,DeepSeek正式发布DeepSeek-V3.2-Exp模型,这是一个实验性(Experimental)的版本。作为迈向新一代架构的中间步骤,V3.2-Exp在V3.1-Terminus的基础上引入了DeepSeekSparseAttention(可简写作DSA,一种稀疏注意力机制),针对长文本的训练和推理效率进行了探索性的优化和验证。

据介绍,DSA首次实现了细粒度稀疏注意力机制,在几乎不影响模型输出效果的前提下,实现了长文本训练和推理效率的大幅提升。

目前,超算互联网AI社区已汇聚700余款国内外优质开源模型,包括DeepSeek-V3.1-Terminus、DeepSeek-R1-0528、DeepSeek-R1、DeepSeek-V3等DeepSeek系列,用户可登录超算互联网AI社区,实现API调用、Chatbot在线推理对话、国产大模型分布式训练、微调等功能于一体的MaaS服务。

 
版权声明:凡本网注明“来源:中国科学报、科学网、科学新闻杂志”的所有作品,网站转载,请在正文上方注明来源和作者,且不得对内容作实质性改动;微信公众号、头条号等新媒体平台,转载请联系授权。邮箱:shouquan@stimes.cn。
 
 打印  发E-mail给: 
    
 
相关新闻 相关论文

图片新闻
风云三号H星成功发射 太阳能热泵或助数据中心回收浪费能源
一种高糖水果可能降低糖尿病风险 亨廷顿舞蹈症首次采用基因疗法治疗
>>更多
 
一周新闻排行
 
编辑部推荐博文