作者:赵广立 来源: 中国科学报 发布时间:2025-3-7
选择字号:
角力下半场,中国AI亦可“通罗马”

 

■本报记者 赵广立

“DeepSeek公司坚持开放开源的技术路线,推动了人工智能技术在全球的普遍应用,为世界贡献了‘中国智慧’。”

3月4日,在十四届全国人大三次会议新闻发布会上,大会发言人娄勤俭点赞中国人工智能大模型DeepSeek及其团队。面对提问,他进一步说道:“世界丰富多彩,技术进步也不只有一条路径。”

话虽不长,意味深远。DeepSeek通过开源、系统性协同创新和工程上的优化,以较低的成本实现了可媲美世界一流大模型的性能,走出了一条自立自强的大模型技术发展之路。在接受《中国科学报》采访的代表委员和专家们看来,“条条大路通罗马”,随着大模型角力进入下半场,中国人工智能(AI)正迎来历史性的赶超机遇。

从“追赶者”变为“规则改写者”

因为DeepSeek,北京邮电大学人机交互与认知工程实验室主任刘伟“整个春节都过得非常愉快”。他在接受《中国科学报》采访时说,DeepSeek“炸场”之后,“身边的人都很兴奋”。

的确,自1月20日DeepSeek-R1模型发布至今,一个半月的时间里,关于DeepSeek的讨论热度不减。中国工程院院士、计算机专家李国杰撰文“七问DeepSeek”,并说道:“DeepSeek的一鸣惊人可能是一个分水岭,标志着中国AI产业开始从‘技术跟跑’向‘技术并跑和领跑’迈进。”

全国政协委员、中国科学院自动化所研究员赵晓光说,国外也在密切关注DeepSeek,可以说DeepSeek给整个AI领域的发展注入了一股强大的推动力。

以DeepSeek为代表的中国AI大模型崛起,预示着大模型的全球角力进入了下半场。

“大家津津乐道于DeepSeek的‘小力出奇迹’,成本低、效率高,但其实在DeepSeek的突破中,更有意思的是‘巧力出奇迹’,不蛮干、四两拨千斤,这是典型的‘东方智慧’。”刘伟对记者说,DeepSeek采用的多头注意力专家模型等技术方法,体现了他们在大模型的算法和框架优化上的巧夺天工,同时带来了模型发展的新思路——“人类通过Transformer架构实现大模型的路径不再是一条,而是多条”。

“以前只能从硅谷到‘罗马’,现在从杭州也可以到‘罗马’,真正实现了‘条条大路通罗马’。”刘伟说。

李国杰称,DeepSeek的崛起,打破了“高算力和高投入是发展人工智能唯一途径”和“集成电路制程优势=人工智能技术霸权”的迷信,引领AI行业进入以算法和模型架构优化为主,同时高度重视数据质量与规模、理性提高算力的新时期。

“同时,DeepSeek的崛起也标志着中国科技公司从‘追赶者’变为‘规则改写者’。”李国杰说,在全球最关注的人工智能领域,中国正在以颠覆式创新迎接新挑战。

更复杂的竞争模式

正如受访专家们所说,在开启一个崭新的AI时代之后,中国AI依然面临着诸多挑战。

“小力出奇迹”并不意味着规模法则的“破产”,中国依然有发展通用大模型的需要。“未来,AI发展可能呈现‘双轨并行’的格局。”全国政协委员、中国科学院计算技术研究所研究员张云泉在接受《中国科学报》采访时说,一方面,小而精的模型会蓬勃发展,尤其有望在特定场景中发挥重要作用;另一方面,通用基础大模型会继续按照规模法则,通过大算力投入、扩大参数规模实现更强悍的性能。

张云泉表示,对于中国来说,发展通用基础主权大模型仍然是必要的。通用基础大模型是AI技术的基石,能够为各行各业提供强大的基础智能。同时,中国在“小而精”模型的研发中,要更加注重芯片、算法和生态系统的自主可控,进而开辟高效、绿色的AI发展路径。

他的这番话也指向了AI发展进程中的另一大变化——AI产业不再是过去简单的“单点技术竞赛”,而是转向了更复杂的竞争模式,既包括芯片、模型和算力的比拼,也包含技术规则、市场份额、治理权力等更复杂的方面。

“要实现人工智能自立自强,最困难的是构建自主可控的产业生态。”李国杰指出,从长远来讲,我们需要开发一套比英伟达公司“统一计算设备架构”(即CUDA,英伟达基于GPU的软件生态)更优秀的自主可控的AI软件工具系统,重构AI软件生态。

“实现这个目标需要周密的规划和长期努力,相关部门应下决心组织全国的开发力量,充分调动上下游企业的积极性,完成这件大事。”李国杰说。

值得欣慰的是,DeepSeek的开源模式,让人们看到了AI开放生态建设的曙光。

北京并行科技股份有限公司AI云联合创始人赵鸿冰对记者说,DeepSeek的崛起带动了推理大模型的应用,“推理市场”将迎来爆发,而这对国产芯片而言是重大机遇。另外,在开源开放的背景下,国产相关软硬件技术更容易实现生态协同。

“万紫千红春满园”

一花独放不是春,万紫千红春满园。

DeepSeek之外,测评水平超过Sora的可灵视频大模型、中文理解能力评分超GPT-4 Turbo的通义千问Qwen2.5-Max、在GitHub衍生工具超过1200个的智谱AI GLM-4……这些中国AI,正成为一股不容忽视的力量。

近日,全国人大代表、科大讯飞董事长刘庆峰推介了讯飞星火大模型的更新:基于全国产算力,科大讯飞升级了星火大模型X1,它的推理性能可对标DeepSeek“满血版”。

不过,他也看到,目前国产算力软件生态基础薄弱,算子库、工具链、开源训练框架及开发平台等配套工具尚不完善,“我国亟须加快推进基于国产软硬件底座的大模型研发创新、场景应用、生态开放等全链条发展”。

为此,刘庆峰建议,一方面,我国要依托广泛的AI应用场景,积极推广大模型在产业领域的应用,并形成数据飞轮,让中国率先获得AI产业落地红利;另一方面,要专项支持生态体系建设,加快形成国产大模型生态体系和工具链,并支持大模型开发者开源社区建设。

刘伟特别提到,中国在落地应用场景的优势,会随着中国AI水平的提高得到进一步放大。“DeepSeek‘出圈’后,产业界的同行也很兴奋,比如制造业可以跟DeepSeek‘结对子’,中国的产业优势加上AI优势,有可能给世界AI发展带来一个新景观。”

全国人大代表、中国工程院院士高文也公开指出,未来文字、图像、音频、视频等多元数据处理需求不断涌现,大语言模型以及多模态大模型技术将不断创新,完成更复杂的任务,推动各行业智能化升级,AI应用前景大有可为。

“科学探索从来不是‘华山一条路’,尤其是模仿人类智能方面。”赵晓光说,“相信未来在国家的大力支持下,在一代代科研人员的努力下,我们一定可以跟全世界的AI研究者共同进步,中国也会在未来涌现出更多具有颠覆性的创新故事,引领AI的历史进程。”

《中国科学报》 (2025-03-07 第4版 两会)
 
 打印  发E-mail给: 
    
 
相关新闻 相关论文

图片新闻
AI助力更快探测恒星合并 全球海冰面积降至历史最低水平
光首次被转化为超固体 亚马孙森林砍伐让雨季更潮、旱季更旱
>>更多
 
一周新闻排行
 
编辑部推荐博文