作者:李木子 来源: 中国科学报 发布时间:2023-12-8
选择字号:
谷歌发布人工智能模型“双子座”
据称性能优于GPT-4模型和人类专家

 

“双子座”能处理文字、音频和视频。图片来源:谷歌

本报讯 12月6日,美国谷歌公司推出了一款名为“双子座”的新型人工智能模型。据称,该模型在一系列智能测试中优于人工智能研究公司OpenAI的GPT-4模型和人类专家。

谷歌首席执行官Sundar Pichai在今年5月谷歌I/O大会上透露了“双子座”的存在,尽管当时它仍处于训练阶段。但当天,该公司宣布将向公众开放这款尖端模型。

“双子座”已经为不同的应用程序开发了3个版本,分别为Nano、Pro和Ultra,它们在大小和功能上都有所增加。谷歌拒绝回答有关Pro和Ultra的大小、参数数量、训练数据的规模及来源等问题。

最小的版本Nano适用于智能手机,它有两种型号:一种用于速度较慢的手机,具有18亿个参数;另一种用于功能更强大的设备,具有32.5亿个参数。用参数比较人工智能模型的能力并不精确,但据传GPT-4包括1.7万亿个参数,Meta的LLAMA-2有700亿个参数。

谷歌称,“双子座”中端版本Pro击败了其他一些型号,如OpenAI的GPT3.5,而更强大的版本Ultra的能力超过了所有现有人工智能型号。它在行业标准MMLU基准测试中得分为90%,而人类专家的得分预计为89.8%。

这是人工智能首次在测试中击败人类,也是现有模型中的最高得分。该测试涉及一系列棘手的问题,包括逻辑谬误、日常生活中的道德、医学、经济和地理问题。

在同样的测试中,GPT-4得分为87%,LLAMA-2得分为68%,Anthropic的Claude 2得分为78.5%。在其他9项常见基准测试中,Gemini在8项中击败了所有模型。

Pro版本将集成到谷歌今年3月推出的在线聊天机器人“巴德”中。该公司表示,巴德高级版将于明年初推出,并采用更大的Ultra。

谷歌DeepMind的Eli Collins表示,“双子座”是该公司最大、能力最强的机型,也是最通用的机型,这意味着它可以适应各种任务。与目前许多专注于文本的模型不同,“双子座”接受了文本、图像和声音训练,并能够接受所有格式的输入和输出。

Collins表示,“双子座”“几乎在每个领域都是最先进的”,它仍在测试中,以确定在不同媒介、语言和应用程序中的工作能力。“我们仍在努力了解Ultra的所有新功能。”他说。

在发布会上,“双子座”没有任何版本可供测试,但谷歌展示了该人工智能解决家庭作业问题和处理实时视频输入的效果。

谷歌表示,它在开发软件方面也比以前的型号更好。他们现在发布了一款由“双子座”支持的人工智能代码生成器,据称它可以击败85%的人类程序员。(李木子)

《中国科学报》 (2023-12-08 第2版 国际)
 
 打印  发E-mail给: 
    
 
相关新闻 相关论文

图片新闻
大规模调查揭示万余种食物相关微生物 科学家揭示超铁元素核合成新机制
6000年古迹揭示石器时代建筑者的工程智慧 森林可持续经营:给陆地碳汇扩容
>>更多
 
一周新闻排行
 
编辑部推荐博文