近日,西南交通大学计算机与人工智能学院教授李天瑞团队从人类认知和三维世界本身具有的多层次视角,首次提出了面向三维语义分割的深度层次学习模型和理论分析框架。相关成果发表于《计算机视觉国际期刊》。
3D场景的分层语义理解是计算机视觉领域的关键挑战,如何有效捕捉和利用物体之间的层次关系一直是研究的难点。本论文从人类认知固有的层次特性出发,首次从理论上构建了跨层次语义一致性与各层熵最大化之间的理论关系,搭建了层次学习的理论分析框架。
基于此理论,团队构建了深度层次学习方法,设计了分层嵌入融合模块,有效捕获点与点之间的层次关系,通过引入层次正则化项,将不同层级预测间的层次连贯性与分类损失有机结合。最后,借助视觉语言模型,开发了自动高效构建类别层次结构的技术,拓展了层次学习的适用范围。
实验结果表明,该研究所提出的深度层次学习模型能显著提高3D语义分割性能,为自动驾驶、城市规划和数字孪生等领域提供了重要技术支持。
相关论文信息:https://doi.org/10.1007/s11263-025-02387-6
版权声明:凡本网注明“来源:中国科学报、科学网、科学新闻杂志”的所有作品,网站转载,请在正文上方注明来源和作者,且不得对内容作实质性改动;微信公众号、头条号等新媒体平台,转载请联系授权。邮箱:shouquan@stimes.cn。