大模型应用是否会复制“苹果时刻”—新闻

作者：沈湫莎来源：文汇报发布时间：2024/5/2 11:43:27

选择字号：小中大

大模型通向应用之路颇似当年移动互联网崛起之时

大模型应用是否会复制“苹果时刻”

最近一两个月，不少哔哩哔哩（B站）用户发现，各种大模型使用教程视频越来越多了，智谱、Kimi Chat、文心一言、通义千问……业内人士表示，头部大模型厂商几乎已全部入局，仅在B站，品牌方的广告投入就是去年的3-4倍。

4月底，在发布日日新大模型5.0版后，商汤科技的股价一度上涨超过30%，当周股价涨幅近100%。与一年前发布会上“秀肌肉”不同，这次商汤科技把展示重点放在了大模型应用上，写代码、扩图、文生视频等功能获得好评。

当下大模型应用“你方唱罢我登场”的样子，颇有当年移动互联网崛起的影子。只不过从某种意义上说，直到2008年苹果推出App商店重新定义应用下载逻辑后，苹果手机才真正成为一款革命性产品。大模型应用是否也会复制这样一个“苹果时刻”，令人期待。

八成大模型应用可通过端侧解决

加载一个页面，人们愿意等待的极限时长是多久？研究数据表明，超过3秒，57%的人会离开。要想留住用户，必须守住“3秒定律”，大模型应用也不例外。

日前举行的商汤科技技术交流日活动上，商汤科技董事长兼CEO徐立演示了日日新大模型5.0版在扩图上的应用体验：让大模型根据一张图自由角度生成1200万像素及以上的高清图片，只需1.5秒。当日日新完成3张扩图后，另一款大模型才输出一张图。这番演示让现场自发响起一阵掌声。

日日新大模型5.0版在响应速度上的大幅领先，与其拥有端侧能力有关。徐立认为，今年是大模型在端侧应用的元年。所谓端侧，即包括手机、个人电脑、智能汽车等在内的终端产品，包含了大模型大部分的应用载体和场景。

与分布式计算同理，端侧大模型只需调用少部分资源就可输出用户想要的结果，而不像ChatGPT，每回答一个问题都要在其庞大的参数中“大海捞针”，能耗和成本非一般客户所能承担。

商汤科技很早就意识到要抓住端侧推动大模型应用落地。2022年9月，公司发布的自动驾驶UniAD就是一个端到端的大模型。一年后，特斯拉也明确其量产的智能车上将会安装端到端的大模型。

我国30亿台的手机市场是大模型厂商发力的另一个“端口”。商汤科技联合创始人、首席科学家王晓刚表示，未来手机上的模型一定是一个端云结合的模型，可能形成80%的大模型调用通过端上解决，少部分通过云端解决的格局。

所有学科都将拥有“AI研究员”

AI for Science（人工智能驱动的科学研究）是大模型应用的重要领域。继推出气象大模型风乌、科学大模型浦科化学之后，上海人工智能实验室最近又联合崖州湾国家实验室和中国农业大学发布了首个种业大语言模型丰登，填补了我国在AI育种领域的技术空白。

据介绍，这三个大模型都是在书生·浦语2.0强大的基座模型能力的基础上，针对不同的应用领域进行专业学科的知识训练，从而获得处理专业领域任务的能力。更有意思的是，由于书生·浦语2.0的逻辑推理能力大幅增强，三个垂类大模型都具备了一定程度的泛科学涌现能力，即学科间的融会贯通，成为具备“AI研究员”潜力的大模型。

“此前，科研人员往往需要跨越众多领域查阅文献、数据，才能找出不同现象之间的联系，现在可由大模型自主学习，发掘学科之间的复杂关联，从而生成新的知识结构。从某种意义上说，这类大模型可承担一部分研究员的工作。”上海人工智能实验室相关人员表示。

以浦科化学为例，研究人员发现，尽管没有对浦科化学进行数学和物理学科的训练，模型在大学数学、大学物理、STEM（科学、技术、工程和数学）等相关领域测试中也获得了最佳成绩，甚至在道德场景、人文科学、社会科学等分项任务上也展现出了优异的平均性能。

从长远看，所有学科都可以拥有自己的垂类大模型。当下，上海人工智能实验室AI for Science团队正面向化学、物理、生命、地球等科学领域，通过深入研究各学科基础理论，结合最新人工智能理论，加速AI在化学、药物研发、新材料、气象等领域的渗透与落地。

大模型正在追求“小赛道”

“ChatGPT引发百模大战时，我们一度以为大模型是大厂专属，但很快我们就发现这一轮大模型应用竞赛与移动互联网时代的竞争一样，需要许多行业的Know-how（默会知识）。”蜜度蜜巢总裁刘益东说。去年9月，蜜度蜜巢成为入驻全国首个大模型生态社区“模速空间”的首批企业之一。

从今年的市场发展来看，应用侧的“百模大战”比刘益东预想的来得更早。比如，长文本是当下打得最热的“赛点”，凭借一次能投喂两套《三体》三部曲的体量优势，月之暗面从国内一众AI大模型公司中脱颖而出，成为国内大模型“四小龙”之一。

尽管也有在长文本中实现“大海捞针”的能力，蜜度蜜巢仍选择从此前团队经营多年的政务领域切入大模型应用。比如，基于公司自研的蜜巢政务大模型应用“知知通”正在便民服务热线中辅助坐席快速作答。过去，话务员至少需要5分钟才能厘清电话那头的口语化表述和核心诉求，现在依托全面的数字知识库，客服仅需数秒即可从大段语音对话中抓取关键信息，5-10秒即可答复用户。

小厂的大模型应用追求“一招鲜”，大厂也在走向差异化。阿里云的通义千问、百度的文心一言、字节跳动的豆包这三款大模型App的定位分化已相当明显。其中，通义千问App不仅是一款大型预训练语言模型，更整合了创意文案、办公助理、学习助手、趣味生活等多个方面预设对话角色；豆包则精准定位语言对话模型，除了陪用户聊天对话外，它会主动给用户发消息以强化虚拟社交属性；文心一言通过多轮升级迭代后，当前已具有非常明显的平台属性。

在刘益东看来，大模型时代不会是某款明星应用包打天下，更可能是各个垂直细分领域都有个性化的行业解决方案，通过众多智能体高效协同协助人们完成某项事情。

特别声明：本文转载仅仅是出于传播信息的需要，并不意味着代表本网站观点或证实其内容的真实性；如其他媒体、网站或个人从本网站转载使用，须保留本网站注明的“来源”，并自负版权等法律责任；作者如果不希望被转载或者联系转载稿费等事宜，请与我们接洽。

编辑部推荐博文
基金申请季，这里有2份攻略请查收！科学网2026年1月十佳博文榜单公布！打碗花、打破碗花花、牵牛花、喇叭花，还分不清？寒假港澳之旅：理想和现实盘点2025年在Nature发文Top 10的中国机构温敏性结晶和刻蚀碳布电极构筑高性能液态铜基热电池更多>>