2月9日,鹏城实验室发布消息称,中国算力网开源开放试验场——OpenI启智社区已上线DeepSeek系列模型,进一步降低了国内开发者的使用门槛。
近年来,人工智能技术的突破性进展,离不开两大核心驱动力——强大的算力基础设施与开放协作的用户生态。在中国科技自立自强的战略背景下,由鹏城实验室牵头建设的中国算力网正不断推动国内自主算力资源迈入“全民共享”时代。
今年新春,国内外AI界都在为DeepSeek而沸腾。自2024年底震撼发布其新一代模型以来,DeepSeek凭借其前瞻性的开源策略与卓越的技术创新,迅速跃升为AI领域的焦点,并在国内外AI模型界赢得了广泛的关注与赞誉。
为了进一步降低国内AI开发者参与门槛,OpenI启智社区作为“中国算力网开源开放试验场”,已在春节期间及时通过“大模型基地”上线DeepSeek系列模型(包括“自然语言处理”的DeepSeek-V3和DeepSeek-R1-Distill-Qwen、DeepSeek-R1-Distill-Llama系列不同参数模型,以及“计算机视觉”的DeepSeek-CV系列模型)。
记者了解到,无需进行复杂繁琐的配置,开发者可直接基于已上线的模型和社区提供的算力资源、一站式AI开发环境自行开展模型验证和测试,体验DeepSeek模型的强大功能。
依托中国算力网卓越的算力调度与智能分配能力,OpenI启智社区现已成功部署DeepSeek-R1满血版(671B),且已适配英伟达GPU资源,并积极携手全国各地的算力中心合作伙伴,共同开放更多经过深度适配的普惠自主算力资源,包括华为的NPU、天数智芯的GPGPU、海光的DCU以及燧原的GCU等,为广大开发者提供更加丰富的选择。
值得一提的是,在鹏城实验室与华为昇思MindSpore及华为昇腾团队的通力协作下,他们已完成DeepSeek部分模型在昇腾NPU 910A、910B上的适配工作,这些模型现已能在MindSpore与PyTorch框架上顺畅运行,并已通过OpenI启智社区开源开放。
与此同时,“中国算力网开源开放试验场”合作伙伴也将于近期完成两个版本模型的部署。借助中国算力网,鹏城实验室将硬件资源高效整合,形成“算力云际池化”模式,旨在帮助开发者在使用DeepSeek模型时实现计算效率的大幅提升。
版权声明:凡本网注明“来源:中国科学报、科学网、科学新闻杂志”的所有作品,网站转载,请在正文上方注明来源和作者,且不得对内容作实质性改动;微信公众号、头条号等新媒体平台,转载请联系授权。邮箱:shouquan@stimes.cn。