科学网—一年零一月，文心大模型进化成AI创造“底牌”

作者：赵广立来源：中国科学报发布时间：2024-4-18

选择字号：小中大

一年零一月，文心大模型进化成AI创造“底牌”

■本报记者赵广立

“未来，自然语言将成为新的通用编程语言。”

4月16日，Create 2024百度AI开发者大会在深圳举行。百度公司董事长兼首席执行官李彦宏作“人人都是开发者”的主题演讲，并带来了“开箱即用”的三大AI（人工智能）开发工具——智能体开发工具AgentBuilder、AI原生应用开发工具AppBuilder、各种尺寸的模型定制工具ModelBuilder。

这是自2023年10月文心大模型4.0发布后出现的全新面孔。值得一提的是，文心大模型此次升级，几乎全是“开发者友好”视角：以文心大模型为基础，为开发者提供所需的开发工具。李彦宏说：“未来开发应用就像拍短视频一样简单，人人都是开发者，人人都是创造者。”

让人人成为创造者，文心大模型的底气是什么？百度首席技术官王海峰在大会上的主题演讲中给出了答案——“技术筑基，星河璀璨”。

进化出会思考的智能体

诞生至今，文心大模型专注于一件事：能力进化。

2023年3月16日，国内首个知识增强大语言模型文心一言问世。此后的一年零一个月里，文心大模型持续快速迭代。至2023年10月17日，文心大模型4.0亮相“百度世界2023”。文心4.0基于万卡算力和飞桨平台，并通过与飞桨平台联合调优，实现了多维数据、多阶段对齐、可再生训练等技术创新。

时隔半年后，Create 2024百度AI开发者大会上的文心大模型又有了“新花样”：在技术架构中正式增加了“智能体”。

智能体并不是第一次出现在文心大模型的框架下。

去年10月，百度就在文心大模型中引入了智能体机制。王海峰介绍，借鉴《思考，快与慢》一书阐述的智能系统，百度在基础大模型的基础上研制了虽反应慢但更理性、更准确的“系统2”，让大模型像人一样理解、规划、反思，并在一定程度上将思考过程白盒化，使大模型在完成复杂任务的同时，还可以在环境中持续学习、自主进化。

这其中的“思考过程”是怎样的？具体是如何实现的？

王海峰解释说，系统2在基础模型上增加思考增强训练，包括思考过程的有监督精调、行为决策的偏好学习、结果反思的增强学习，就得到了思考模型。有了思考模型，大模型就可以像人一样，会阅读说明书、学习工具的使用方法，进一步“懂得”合理运用工具来完成任务。

在现场，文心一言接到王海峰“我要到大湾区出差一周，想了解一下天气变化，好决定带什么衣服。请帮我查一下，并整理成表格”的指令后，启动智能体机制，将需求拆解成多个子任务，先后调用联网工具查天气，调用“代码解释器”画温度趋势图，进而根据天气情况提出带衣物建议，并对结果进行反思、确认，最后自动汇总成表格。

代码能力助人人成为开发者

面向广大用户对低门槛开发的需求，百度基于文心大模型的自然语言能力和代码能力，开发了代码智能体和智能代码助手。

秉持“用模型写代码让复杂的任务变简单”的思想，文心大模型在思考模型的基础上，结合代码解释器构成了代码智能体。它的工作原理大致如下：首先，思考模型理解用户需求，把完成任务的指令和相关信息整合成提示，输入代码解释器；然后，代码解释器根据提示，把自然语言表达的用户需求翻译成代码并执行，得到执行结果或调试信息；接着，思考模型对代码解释器的执行结果进行反思、确认，若正确则把结果返回给用户，不正确则继续更新。

通过这样的机制，智能体理解用户需求，实现“只要说说话，就能完成AI应用开发”。

智能代码助手则可以帮助专业程序员更高效、便捷地写出高质量代码。在模型效果不断提升的基础上，百度进一步构建了智能代码助手上下文增强、私域知识增强、流程无缝集成等能力。

“代码智能体是让大家有机会做之前只有程序员才能做的开发，智能代码助手则意在帮助专业程序员写出更好的代码，是程序员的AI同侪。”王海峰谈到，作为人类思维的载体，自然语言代表了人的思考；有着严密逻辑的形式语言是计算机可执行的程序。从自然语言到形式语言，打通了从思考到执行的过程。

最大化平衡效果、效率和成本

除了智能体、代码能力外，王海峰还着重介绍了多模型技术。

“在大模型应用落地过程中，效果、效率和成本都很重要。在实际应用中，需要从场景需求出发，选择最适合的模型。”王海峰说，大模型效果好、小模型速度快，为了更好地平衡效果与效率，多模型技术是必经之路。

他介绍，对此，百度研制了基于反馈学习的端到端多模型推理技术，构建了智能路由模型，可进行端到端反馈学习，充分发挥不同模型处理不同任务的能力，最终实现效果、效率和成本的最佳平衡。

王海峰提到，在高效低成本模型生产方面，技术团队研制了大小模型协同的训练机制，可以有效进行知识继承，高效生产高质量小模型，也可以利用小模型实现对比增强，帮助大模型训练。高效低成本模型生产机制，助力应用速度更快、成本更低、效果更好。

文心大模型在其他方面持续创新，包括基于模型反馈闭环的数据体系、基于自反馈增强的大模型对齐技术及多模态技术等。王海峰现场公布，文心大模型4.0的效果持续提升，相比半年前提高了52.5%。

王海峰表示，文心大模型的持续快速进化，得益于百度在芯片、框架、模型和应用上的全栈布局，尤其是飞桨深度学习平台和文心的联合优化。文心大模型的周均训练效率达到98.8%，相比一年前文心一言发布时，训练效率提升到当时的5.1倍，推理105倍。

王海峰透露，截至目前，飞桨文心生态已凝聚1295万名开发者，服务24.4万家企事业单位，基于飞桨和文心创建89.5万个模型。同时，文心一言累计用户规模已达2亿，日均调用量也达到了2亿，高效满足了用户工作、生活和学习需求。

王海峰介绍了百度AI人才计划的最新进展。百度在2020年提出5年为全社会培养500万名AI人才，目前这一目标已提前达成。他表示：“未来，百度将继续投身人才培养，让人才的点点星光汇成璀璨星河。”

《中国科学报》 (2024-04-18 第1版要闻)

编辑部推荐博文
科学网2024年6月十佳博文榜单公布！空气污染能导致骨质疏松《科学》青藏高原考察：吉隆沟昆虫多样性监测科研写作利器推荐！让你的论文“图”出重围研究生如何提升英语使用能力？百世登出版集团倾情推荐美捷登更多>>