科学网—角力下半场，中国AI亦可“通罗马”

作者：赵广立来源：中国科学报发布时间：2025-3-7

选择字号：小中大

角力下半场，中国AI亦可“通罗马”

■本报记者赵广立

“DeepSeek公司坚持开放开源的技术路线，推动了人工智能技术在全球的普遍应用，为世界贡献了‘中国智慧’。”

3月4日，在十四届全国人大三次会议新闻发布会上，大会发言人娄勤俭点赞中国人工智能大模型DeepSeek及其团队。面对提问，他进一步说道：“世界丰富多彩，技术进步也不只有一条路径。”

话虽不长，意味深远。DeepSeek通过开源、系统性协同创新和工程上的优化，以较低的成本实现了可媲美世界一流大模型的性能，走出了一条自立自强的大模型技术发展之路。在接受《中国科学报》采访的代表委员和专家们看来，“条条大路通罗马”，随着大模型角力进入下半场，中国人工智能（AI）正迎来历史性的赶超机遇。

从“追赶者”变为“规则改写者”

因为DeepSeek，北京邮电大学人机交互与认知工程实验室主任刘伟“整个春节都过得非常愉快”。他在接受《中国科学报》采访时说，DeepSeek“炸场”之后，“身边的人都很兴奋”。

的确，自1月20日DeepSeek-R1模型发布至今，一个半月的时间里，关于DeepSeek的讨论热度不减。中国工程院院士、计算机专家李国杰撰文“七问DeepSeek”，并说道：“DeepSeek的一鸣惊人可能是一个分水岭，标志着中国AI产业开始从‘技术跟跑’向‘技术并跑和领跑’迈进。”

全国政协委员、中国科学院自动化所研究员赵晓光说，国外也在密切关注DeepSeek，可以说DeepSeek给整个AI领域的发展注入了一股强大的推动力。

以DeepSeek为代表的中国AI大模型崛起，预示着大模型的全球角力进入了下半场。

“大家津津乐道于DeepSeek的‘小力出奇迹’，成本低、效率高，但其实在DeepSeek的突破中，更有意思的是‘巧力出奇迹’，不蛮干、四两拨千斤，这是典型的‘东方智慧’。”刘伟对记者说，DeepSeek采用的多头注意力专家模型等技术方法，体现了他们在大模型的算法和框架优化上的巧夺天工，同时带来了模型发展的新思路——“人类通过Transformer架构实现大模型的路径不再是一条，而是多条”。

“以前只能从硅谷到‘罗马’，现在从杭州也可以到‘罗马’，真正实现了‘条条大路通罗马’。”刘伟说。

李国杰称，DeepSeek的崛起，打破了“高算力和高投入是发展人工智能唯一途径”和“集成电路制程优势=人工智能技术霸权”的迷信，引领AI行业进入以算法和模型架构优化为主，同时高度重视数据质量与规模、理性提高算力的新时期。

“同时，DeepSeek的崛起也标志着中国科技公司从‘追赶者’变为‘规则改写者’。”李国杰说，在全球最关注的人工智能领域，中国正在以颠覆式创新迎接新挑战。

更复杂的竞争模式

正如受访专家们所说，在开启一个崭新的AI时代之后，中国AI依然面临着诸多挑战。

“小力出奇迹”并不意味着规模法则的“破产”，中国依然有发展通用大模型的需要。“未来，AI发展可能呈现‘双轨并行’的格局。”全国政协委员、中国科学院计算技术研究所研究员张云泉在接受《中国科学报》采访时说，一方面，小而精的模型会蓬勃发展，尤其有望在特定场景中发挥重要作用；另一方面，通用基础大模型会继续按照规模法则，通过大算力投入、扩大参数规模实现更强悍的性能。

张云泉表示，对于中国来说，发展通用基础主权大模型仍然是必要的。通用基础大模型是AI技术的基石，能够为各行各业提供强大的基础智能。同时，中国在“小而精”模型的研发中，要更加注重芯片、算法和生态系统的自主可控，进而开辟高效、绿色的AI发展路径。

他的这番话也指向了AI发展进程中的另一大变化——AI产业不再是过去简单的“单点技术竞赛”，而是转向了更复杂的竞争模式，既包括芯片、模型和算力的比拼，也包含技术规则、市场份额、治理权力等更复杂的方面。

“要实现人工智能自立自强，最困难的是构建自主可控的产业生态。”李国杰指出，从长远来讲，我们需要开发一套比英伟达公司“统一计算设备架构”（即CUDA，英伟达基于GPU的软件生态）更优秀的自主可控的AI软件工具系统，重构AI软件生态。

“实现这个目标需要周密的规划和长期努力，相关部门应下决心组织全国的开发力量，充分调动上下游企业的积极性，完成这件大事。”李国杰说。

值得欣慰的是，DeepSeek的开源模式，让人们看到了AI开放生态建设的曙光。

北京并行科技股份有限公司AI云联合创始人赵鸿冰对记者说，DeepSeek的崛起带动了推理大模型的应用，“推理市场”将迎来爆发，而这对国产芯片而言是重大机遇。另外，在开源开放的背景下，国产相关软硬件技术更容易实现生态协同。

“万紫千红春满园”

一花独放不是春，万紫千红春满园。

DeepSeek之外，测评水平超过Sora的可灵视频大模型、中文理解能力评分超GPT-4 Turbo的通义千问Qwen2.5-Max、在GitHub衍生工具超过1200个的智谱AI GLM-4……这些中国AI，正成为一股不容忽视的力量。

近日，全国人大代表、科大讯飞董事长刘庆峰推介了讯飞星火大模型的更新：基于全国产算力，科大讯飞升级了星火大模型X1，它的推理性能可对标DeepSeek“满血版”。

不过，他也看到，目前国产算力软件生态基础薄弱，算子库、工具链、开源训练框架及开发平台等配套工具尚不完善，“我国亟须加快推进基于国产软硬件底座的大模型研发创新、场景应用、生态开放等全链条发展”。

为此，刘庆峰建议，一方面，我国要依托广泛的AI应用场景，积极推广大模型在产业领域的应用，并形成数据飞轮，让中国率先获得AI产业落地红利；另一方面，要专项支持生态体系建设，加快形成国产大模型生态体系和工具链，并支持大模型开发者开源社区建设。

刘伟特别提到，中国在落地应用场景的优势，会随着中国AI水平的提高得到进一步放大。“DeepSeek‘出圈’后，产业界的同行也很兴奋，比如制造业可以跟DeepSeek‘结对子’，中国的产业优势加上AI优势，有可能给世界AI发展带来一个新景观。”

全国人大代表、中国工程院院士高文也公开指出，未来文字、图像、音频、视频等多元数据处理需求不断涌现，大语言模型以及多模态大模型技术将不断创新，完成更复杂的任务，推动各行业智能化升级，AI应用前景大有可为。

“科学探索从来不是‘华山一条路’，尤其是模仿人类智能方面。”赵晓光说，“相信未来在国家的大力支持下，在一代代科研人员的努力下，我们一定可以跟全世界的AI研究者共同进步，中国也会在未来涌现出更多具有颠覆性的创新故事，引领AI的历史进程。”

《中国科学报》 (2025-03-07 第4版两会)

编辑部推荐博文
国自然基金，这项优化让你的申请书更“吸睛”！科学网2026年1月十佳博文榜单公布！我与国家自然科学基金项目结缘40年体重管理简史网络之匙解锁数十年波动难题听许老师“杂谈”后有感更多>>