科学网—这个大模型，最懂徐悲鸿

作者：甘晓来源：中国科学报发布时间：2025-8-18

选择字号：小中大

这个大模型，最懂徐悲鸿

■本报记者甘晓

“这不好看吗？我觉得挺好看的啊！”致力于人工智能（AI）生成内容研究的刘翼豪，对自己用AI生成图片的“差评”，常发出这样的感叹。在他看来，现有的图像质量与美学评估的量化指标似乎不太准确。“我们也不懂到底是我们错了，还是指标体系错了。”

日前，由上海人工智能实验室与中国美术学院联合打造的国内首个专业级美学理解大模型“书生·妙析 ArtiMuse”在2025年世界人工智能大会生态论坛上发布。

作为该模型研发团队负责人，上海人工智能实验室青年科学家刘翼豪在接受《中国科学报》采访时介绍，该模型利用超过30万张图像作为训练集，其中包含1万张自建的精标注图像，具有80亿参数，能够对多种类图像进行精细化、多维度分项评估，还能生成具有专业水准的美学点评，为艺术教育、审美评价、美育普及提供了精确的量化工具。

同时，“书生·妙析 ArtiMuse”还首次将中国传统美学思想与评价体系融入AI算法逻辑，提升了中国在AI美学标准制定中的重要话语权。

AI与艺术的双向奔赴

在中国科学院大学求学期间，刘翼豪曾参与学校官方微信公众号的运营工作。当时，他为科普文章精心绘制的配图收到了直率的反馈：“一看就是‘理工直男’的配图。”作为一个理工男，他不理解，哪里不好看。

从事科研工作后，刘翼豪和众多“理工男”小伙伴产生了共鸣。一个古老而深刻的命题摆在了这个平均年龄只有20多岁的年轻团队面前：什么是美？

一群“理工男”在机缘巧合下找到了中国美术学院教授姚大钧带领的交叉学科研究团队。当时，艺术家们正致力于AI与艺术创作相结合，需要AI技术支持。

刘翼豪介绍，生成与评价是AI艺术创作中相辅相成的两个方面，但当前的研究和应用大多关注生成能力的提升，相比之下，如何评价这些生成作品仍处于缺位的状态。

当他们提出“能否用AI来构建一个更懂‘美’的评价模型”时，双方一拍即合。从研究需求看，刘翼豪带领的团队有算法与工程能力，中国美术学院的团队有艺术理论、审美判断与评价体系构建的经验。

一场AI与艺术的双向奔赴就此开启。

从小学生到掌管美的“神”

“一千个读者心中有一千个哈姆雷特”，对艺术作品的理解常常带有强烈的主观色彩。但在艺术家看来，审美并不完全主观，也存在规律和共识。那么，如何将这种看似主观的审美进行量化，是团队亟须解决的关键问题。

为此，中国美术学院的艺术专家团队根据多年积累的艺术理论和美学标准，提出了7个维度的评价体系，包括构图设计、视觉元素、技术执行、想象创意、主题传达、情感反应、整体完型等，最后形成综合评价。

基于这些标准，一批高质量的包含超过1万张图像的数据集被构建起来。“每张图像不仅有一个总评分，还有针对7个维度的具体分数，每个维度还附有详细的评语，解释了该维度的具体得分原因。”刘翼豪介绍。

有了这些理论和数据基础，下一步就是让AI“学会”这些美学知识。

刘翼豪带领团队先从互联网上搜集了数十万张公开图像及用户评价，对AI进行美学“启蒙”，培养它成为“小学生”。在此基础上，团队再采用前期研发的通用大模型“书生·万象”数据集对这名“小学生”进行专业训练，学习大学课程，逐步提高自身“艺术素养”，达到“本科生”甚至“研究生”的水平。

历经四五个月时间，模型“毕业”了。令人眼前一亮的是，它不仅能给艺术作品打分，还能像专业评审一样说出“为什么美”“哪里不足”。

最后，大家一起为这个模型取了一个意味深长的英文名ArtiMuse，其中“Muse”是指古希腊神话中掌管“美”的“缪斯”，中文名则定为“书生·妙析”。

团队成员充分享受着创新的过程，“玩梗”和“搞技术”并行。一次，大家突发奇想，既然模型可以评价摄影、书法、绘画，能不能评价论文配图？“以后论文配图要是得分低于6.5分，一律不准进论文！”刘翼豪开玩笑说。

研究人员立刻兴致勃勃地用模型给论文配图打分，然后互相支招优化。在他们看来，这种既好玩又较真的态度，恰恰是年轻科研人的独特魅力。

弥补东方美学数据缺失

“书生·妙析 ArtiMuse”具备专业的美学判断力，其审美内核根植于中国文化，源自中国的美学血脉，是目前最懂徐悲鸿、张大千的AI大模型。

在研发团队看来，大模型的发展长期以来由西方主导，训练所用的语料和数据也来自以英文为主的互联网内容，难以对中国传统的水墨画或书法作品作出客观、专业的评价。这是由于在它的训练数据中极少包含这类艺术形式，缺乏对“留白”“意境”“笔墨气韵”等东方美学概念的认知，会将其误判为模糊、杂乱或不完整的作品。

“如果全球普遍依赖这些带有文化偏见的模型进行美学判断，长此以往，可能让人误以为西方审美是‘标准’，而中国传统艺术‘不够好’。”刘翼豪强调，“中国传统文化的审美理解，要由中国人自己解决。”

为此，研究人员专门收集了大量中国传统绘画、书法等艺术作品，由艺术专家团队深入解析与专业点评，并纳入标注数据集中，有效弥补了现有AI在东方美学数据上的缺失。

例如，徐悲鸿的一幅骏马图总分为9.47分，“艺术执行”单项得到了满分10分，评价为“细腻的笔触和柔和的色彩营造出活力与动感，构图平衡和谐”。张大千的一幅荷花图总分为9.55分，评价为“光影交织，视觉冲击力强，具有永恒美感”。

目前，团队正在推动“书生·妙析 ArtiMuse”在多个场景落地应用。其中包括打造AI与设计师协同创作的东方美学创作平台，提高艺术创作效率；作为评价工具，引导AI生成内容向美、向善发展，并在艺术比赛、考试中提高筛选效率；与相关机构合作用AI解读馆藏作品，提升大众审美体验，等等。

与“书生·妙析 ArtiMuse”一起成长，也让刘翼豪的艺术水平得到了提高。他为科普文章创作的配图只得到了4.47分，这让他总算理解了“哪里不好看”：“整体视觉元素构成简单，色彩搭配不统一，卡通形象与现实物品结合突兀。”

《中国科学报》 (2025-08-18 第3版综合)

编辑部推荐博文
国自然基金，这项优化让你的申请书更“吸睛”！科学网2026年1月十佳博文榜单公布！如何撰写合格的审稿报告？为您解答审稿人相关问题 \| MDPI 答疑录技术发明与市场交换，双轮驱动创造价值生物存活的哲学我与上海的半生相守更多>>