|
国内首个专业级美学理解大模型上线 |
理工男与艺术家共赴“美的历程” |
|
“谁来教教我男朋友拍照”,社交平台上持续火爆的帖子贡献了许多笑料。什么样的照片、绘画才叫好看?这却是一个关于美学的严肃问题。
日前,由上海人工智能实验室与中国美术学院联合打造的国内首个专业级美学理解大模型“书生·妙析 ArtiMuse”在2025年世界人工智能大会(WAIC)生态论坛上发布。
“书生·妙析 ArtiMuse”研发团队负责人、上海人工智能实验室青年科学家刘翼豪接受《中国科学报》采访时介绍,该模型利用超过30万张图像作为训练集,其中包含1万张自建的精标注图像,具有80亿参数,能够对多种类的图像进行精细化、多维度的分项评估,还能生成具有专业水准的美学点评,为艺术教育、审美评价、美育普及提供了精确的量化工具。
同时,“书生·妙析 ArtiMuse”还首次将中国传统美学思想与评价体系融入人工智能(AI)算法逻辑,奠定了中国在AI美学标准制定中的重要话语权。
刘翼豪在发布会现场。
?
“书生·妙析 ArtiMuse”二维码。
AI与艺术的双向奔赴
“这不好看吗?我觉得挺好看的啊!”刘翼豪致力于AI生成内容研究,面对自己用AI生成的图片受到“差评”,常发出这样的疑问。
刘翼豪发现,现有的图像质量与美学评估的量化指标似乎不太准确,“我们也不懂到底是我们错了,还是指标体系错了。”
早在中国科学院大学求学期间,刘翼豪就曾参与学校官方微信公众号的运营工作。当时,他为科普文章精心绘制的配图,收到了直率的反馈:“一看就是‘理工直男’配图。”作为一个理工男,他不理解,哪里不好看。
刘翼豪曾经为科普文章绘制的图片。
从事科研工作后,刘翼豪和众多“理工男”小伙伴产生了共鸣。一个古老而深刻的命题摆在了这支平均年龄只有20岁出头的年轻团队面前:什么是美?
一群“理工男”在各种机缘巧合下,找到了中国美术学院教授姚大钧带领的一支交叉学科研究团队。艺术家们致力于AI与艺术创作相结合,正需要AI技术支持。
刘翼豪介绍,生成与评价是AI艺术创作中相辅相成的两个方面,但当前的研究和应用大多关注生成能力的提升,相比之下,如何评价这些生成作品仍处于缺位的状态。
当他们提出“能否用AI来构建一个更懂‘美’的评价模型”这一设想时,双方一拍即合。从研究需求来看,刘翼豪带领的团队有算法与工程能力,中国美术学院的团队有艺术理论、审美判断与评价体系构建的经验。
一场AI与艺术的双向奔赴就此开启。这支年轻团队不满足于让AI只做理工科的“解题机器”,而是希望让AI拥有情感,理解美,参与艺术创作。
从小学生到掌管美的“神”
“一千个读者心中有一千个哈姆雷特”,对艺术作品的理解常常带有强烈的主观色彩。但在艺术家看来,审美并不完全主观,存在着规律和共识。那么,如何将这种看似主观的审美进行量化,是团队亟须解决的关键问题。
为此,中国美术学院的艺术专家团队根据多年积累的艺术理论和美学标准,提出了7个维度的评价体系,包括构图设计、视觉元素、技术执行、想象创意、主题传达、情感反应、整体完型等,最后形成综合评价。
基于这些标准,一批高质量的数据集构建起来,包含超过10000张图像。“每张图像不仅有一个总评分,还有针对7个维度的具体分数,每个维度还附有详细的评语,解释该维度的具体得分原因。”刘翼豪介绍。
有了这些理论和数据基础,下一步的问题就是,如何教AI“学会”这些美学知识?这回到了刘翼豪团队的专长领域。他们的“学生”是实验室前期研发的通用大模型“书生·万象”。它看似可以回答专业问题,但在艺术专家看来,答案往往是片面的,甚至错误的。
刘翼豪带领团队先从互联网上搜集了数十万张公开图像及用户评价,对AI进行美学“启蒙”,培养它成为“小学生”。
在此基础上,团队再采用前述专业数据集对这名“小学生”进行专业训练,带它上大学教授的“课程”,逐步提高自身“艺术素养”,达到与“本科生”甚至“研究生”相当的水平。
历经4、5个月时间,它“毕业”了。令人眼前一亮的是,它不仅能给艺术作品打分,还能像专业评审一样,说出“为什么美”“哪里不足”。
最后,大家一起为这个模型取了一个意味深长的英文名ArtiMuse,其中“Muse”是指缪斯,那位众所周知古希腊掌管“美”的神,中文名则定为“书生·妙析”。
团队成员充分享受着创新的过程,“玩梗”和“搞技术”并行。一次,大家突发奇想,既然模型可以评价摄影、书法、绘画,能不能评价论文配图?“以后论文配图要是得分低于6.5分,一律不准进论文!”刘翼豪半开玩笑地说。
全员立刻兴致勃勃地用模型给自己的配图打分,然后互相支招优化,这让科研气氛瞬间变成“图像审美改造大赛”。在他们看来,这种既好玩又较真的态度,恰恰是年轻科研人的独特魅力。
最懂徐悲鸿、张大千
“书生·妙析 ArtiMuse”不仅具备专业的美学判断力,其审美内核根植于中国文化,流淌着属于中国的美学血脉,是目前最懂徐悲鸿、张大千的AI大模型。
在研发团队看来,大模型的发展长期以来由西方主导,训练所用的语料和数据也来自以英文为主的互联网内容,难以对中国传统的水墨画或书法作品给出客观、专业的评价。这是由于在它的训练数据中极少包含这类艺术形式,缺乏对“留白”“意境”“笔墨气韵”等东方美学概念的认知,会将其误判为模糊、杂乱或不完整的作品。
“如果全球普遍依赖这些带有文化偏见的模型进行美学判断,长此以往可能让人误以为西方审美是‘标准’,而中国传统艺术‘不够好’。”刘翼豪强调,“中国传统文化的审美理解,要靠中国人自己来解决。”
为此,他们专门收集了大量中国传统绘画、书法等艺术作品,由艺术专家团队深入解析与专业点评,并纳入标注数据集中,有效弥补了现有AI在东方美学数据上的缺失。
例如,徐悲鸿的一幅骏马图总分为9.47分,“艺术执行”单项得到了满分10分,评价为:“细腻的笔触和柔和的色彩营造出活力与动感,构图平衡和谐。”张大千的一幅荷花图总分为9.55分,评价为:“光影交织,视觉冲击力强,具有永恒美感。”
“书生·妙析 ArtiMuse”对徐悲鸿骏马图的评价。图片均由受访者提供
目前,团队正在推动“书生·妙析 ArtiMuse”在多个场景落地应用。包括,打造AI与设计师协同创作的东方美学创作平台,提高艺术创作效率;作为评价工具,引导AI生成内容向美、向善发展,并在艺术比赛、考试中提高筛选效率;与相关机构合作用AI解读馆藏作品,提升大众审美体验等等。
当然,和“书生·妙析 ArtiMuse”一起成长,刘翼豪的艺术水平也得到了提高。他为科普文章创作的配图只得到了4.47分,让他总算理解了“哪里不好看”:“整体视觉元素构成简单,色彩搭配不统一,卡通形象与现实物品结合突兀。”
版权声明:凡本网注明“来源:中国科学报、科学网、科学新闻杂志”的所有作品,网站转载,请在正文上方注明来源和作者,且不得对内容作实质性改动;微信公众号、头条号等新媒体平台,转载请联系授权。邮箱:shouquan@stimes.cn。