|
|
|
|
|
同济大学团队与合作者研究成果入选AAAI“杰出论文奖” |
|
|
近日,人工智能领域顶级会议AAAI2026年会在新加坡举行。会上公布了“杰出论文奖”等奖项,同济大学计算机科学与技术学院胡亮教授团队与合作者完成的LLM2CLIP: Powerful Language Model Unlocks Richer Cross-Modality Representation是5篇获奖论文之一。
同济大学团队与合作者的论文入选AAAI“杰出论文奖”。图源同济大学
据了解,对比语言-图像预训练(CLIP)是当前人工智能(AI)领域具有重要影响力的多模态基础模型,其核心思想是通过大规模图像与文本数据的联合训练,使计算机能够在同一语义空间中理解图像和语言,从而支持图像识别、检索等多种任务。
随着大型语言模型(LLM)的快速发展,其在语言理解和世界知识建模方面展现出显著优势。基于这一背景,研究团队深入探讨了如何将LLM的强大语言理解能力引入CLIP框架,以提升模型对复杂、冗长文本描述的理解能力和视觉感知能力。为此,团队提出了一种高效的模型微调方法,在保留原有CLIP结构的基础上,将LLM有机嵌入其中,实现对多模态表示能力的增强。
版权声明:凡本网注明“来源:中国科学报、科学网、科学新闻杂志”的所有作品,网站转载,请在正文上方注明来源和作者,且不得对内容作实质性改动;微信公众号、头条号等新媒体平台,转载请联系授权。邮箱:shouquan@stimes.cn。