科学网—百度吴甜：智能体加速产业智能升级

作者：赵广立来源：中国科学报发布时间：2024-9-18

选择字号：小中大

百度吴甜：智能体加速产业智能升级

百度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜，在2024年中国国际服务贸易交易会上发表演讲。百度供图

■本报记者赵广立

“今天的人工智能大模型所具备的思维和规划能力，能够给产业数字引擎带来颠覆性的变化，这个过程是悄然发生的。”

9月12日，在2024年中国国际服务贸易交易会首日，百度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜应邀发表演讲。她提出，当人工智能大模型有了思维能力，它给产业重构带来的变化就已经开启，并与产业发展规律结合，既不像激进者那么乐观，也不像怀疑者那么悲观。

基础大模型为什么强调知识增强

在吴甜的报告题目和现场演讲里，“知识增强大模型”这个关键词被重点强调。这在大模型时代信奉“大力出奇迹”的语境下，显得有些不同。

大模型为什么要强调“知识增强”？

“欠缺知识的模型也许可以推演出一系列的结果，但是‘幻觉’难以控制。”吴甜说，知识增强技术保障了基础大模型拥有完整的知识体系，后者才会给人们带来思维、知识上的帮助。通过“知识内化”和“知识外用”的方式，大模型习得了大量知识，并能综合作用于大模型能力中。

吴甜打了一个比方，就像人在不断学习的过程中，会把很多知识记入脑中并灵活运用。在真正应用时，除了借助脑中已有的知识外，大模型也会采取知识外用的方法来综合运用。目前百度已经构建了5500亿事实的知识图谱，并融入文心大模型中。

“文心一言”的训练过程就受到了这5500亿知识图谱的“洗礼”。现在，文心一言拥有超3亿用户规模，文心大模型日调用次数达到6亿，日处理Tokens文本数量约1万亿。

在基础大模型与应用场景的大模型产品之间，还需建设一层复合人工智能系统——基于大模型的智能体。

连接大模型到应用的关键技术：智能体

吴甜介绍说，基于大模型构建的智能体借鉴了人的思维系统——直觉系统和理性系统。

直觉系统可以给出很直接的答复，但容易出错，常常不能给出用户想要的最终结果，尤其是一些对推理要求比较高的场景。这也是构建理性系统的原因所在——理性系统以思考模型为主体，旨在完成对任务的理解、规划、反思并具备进化的能力。

思考模型，在理性系统中扮演着重要角色。

所谓思考模型，其实就是基于基础大模型进行思考增强训练的模型。吴甜解释说，这些训练包括有监督的精调、行为决策的偏好学习和对结果反馈的增强学习等。由于带有行为决策能力，思考模型不仅可以对任务进行分解和规划，还可以对工具、组件进行调用，协调多个智能体相互协作完成任务。

例如，在简单任务“查一下最近上映的票房排名前五的电影，用柱状图来呈现”中，大模型的思考过程是这样的：先分析用户想要的结果，再调用工具。在该事例中，大模型先借助搜索工具完成对信息的查询，获取近期票房排名前五的电影，再进一步调用工具将票房数据生成柱状图，完成任务。

类似的，在文本创作、代码生成、人工智能作图等任务中，都能看到大模型可以调用多个智能体配合完成任务。吴甜指出，尤其是代码生成，之前的大模型产品往往只能生成某个函数功能的代码或部分代码，而不是系统性完成一个完整任务。现在在多个智能体相互配合之下，大模型可以完成系统级代码。

“代码智能体现在可以帮助使用者完成系统级代码的书写。这既需要能生成代码，也需要有执行代码的能力。”吴甜说，比如用户提出代码需求之后，代码智能体首先对用户需求进行理解和任务规划，然后自主进行架构的设计，并生成一系列代码，再进行反思迭代，最终部署整套代码。在这个过程中，代码智能体可以完成人类程序员的大量繁杂工作。

因此，吴甜认为，智能体是大模型从技术到应用的非常重要的一个环节。原因无他，智能体这样的复合人工智能系统，使大模型产品能够在应用场景中处理更加复杂的任务，拥有更加长程的理解和规划能力。

智能体逐渐成为产业智能引擎

数据显示，迄今为止，文心大模型已累计生成70亿行代码、创作5.9亿篇文章、编撰百万篇专业研报、解答了1.7亿个学习问题、辅助1.3亿人次工作。

论坛上，吴甜表示，随着基础模型的日益强大，开发应用越来越简单，智能体是最有前景的人工智能应用发展方向。

吴甜分享了这样一则事例。在企业产品或知识咨询场景下，大量用户在向企业咨询前，已经掌握了很多背景信息或做了一些调研，算是“专业人士”了。这样的用户在寻求咨询时，想要的答案往往是更细分或者更复杂的，这对回复咨询的业务员或智能系统提出了挑战。

在这一场景下，深度交流成为必需。在运用文心大模型解决这类问题时，需要实现对用户意图、商家画像的双端理解，灵活进行需求分析和挖掘，进而通过大量已有通用知识的积累，再结合行业知识和商家自身知识库，给出更为专业的解答或推荐。数据显示，目前商家智能体每天提供的专业回答数量已经超过250万个。对单个用户来说，深度交流成为现实，最高对话轮数达到288轮。

直播智能体是知识增强大模型赋能产业数字升级的又一鲜活体现。在当前真人直播成本高、时间受限、质量不稳定等问题的困扰下，直播带货这一营销模式在各企业逐步遇到瓶颈。依托于大模型的智能体技术，灵活多样的直播智能体正在消弭这一产业难题，并且可实现直播脚本的个性化定制和多样化风格书写的直播带货智能体，甚至可以在5分钟内生成。

同样，它在文心大模型的支撑下，基于通用知识加上行业知识、产品知识，可以实现灵活的直播问答，且7×24小时在线。根据需要，还可以拥有智能场控——智能暖场和中控，可使整个直播间内容质量和氛围得到保持。

从产业视角来看，大模型技术的长尾效应仍在持续。吴甜认为，技术的变革能推动大量应用创新，应用爆发创造商业价值，商业价值的形成反过来进一步促进技术迭代。大模型已经形成了技术、应用和商业的正向循环，智能体正助力重构产业数字引擎。

“未来，将有更多行业和应用场景依托大模型智能体技术实现更多创新。”吴甜最后表示。

《中国科学报》 (2024-09-18 第2版国际)

编辑部推荐博文
科学网2025年6月十佳博文榜单公布！数据都在论文里，为什么审稿人还说“看不懂”？科研成果评价的三重境界科研揭示钙钛矿光伏器件晶界促进电荷分离过程快乐与教育美国高校如何裁减非教学人员？更多>>