近日,深圳技术大学大数据与互联网学院MIPS团队提出一种图注意力双重集成学习框架(GRADE),可应用于三维点云技术的无监督领域自适应任务。该研究成果发表于《模式识别》。
三维点云技术在机器人技术、自动驾驶、增强现实和虚拟现实等多个领域有着重要应用。简单来说,三维点云是一种通过捕捉和处理物体表面的无数个点,生成物体或场景的三维模型。当前,三维点云技术的主要任务包括物体分类、分割和检测,这些任务的主要挑战在于如何处理点云数据的无序结构以及标注大规模点云数据集。点云数据的无序结构意味着点的顺序没有固定的模式,这与传统的图像数据不同。此外,由于点云数据通常包含数百万个点,手动标注这些数据非常耗时且昂贵。
为了解决这些问题,研究人员正在探索无监督领域自适应(UDA)的方法,旨在无需人工标注大规模点云数据的情况下,实现有效分类和分割。近年来的研究表明,在目标领域的训练过程中加入自监督学习的方法,通过让模型自己生成标注并进行训练,可以显著提升UDA点云任务的性能。然而,大多数现有的方法仅关注几何变形,即点云的形状变化,而忽略了语义信息,这导致了不同领域之间的差距难以弥合。
对此,研究团队提出了一种新的解决方案,即图注意力双重集成学习框架。这一方法通过在源数据上进行初步训练,在目标数据上建立两个协作训练分支(教师-学生模型),每个分支构建一个时间平均教师模型,并将其生成的伪标签传递给另一个分支,这种合作不仅捕捉高级语义信息,还提高了网络的一致性泛化能力和准确重建能力。为了使教师模型生成更可靠的标签,该方法改进了现有的架构,加入了动态图注意力模块,从而更好地挖掘局部邻域点之间的关系。
实验结果显示,GRADE方法在多个无监督领域自适应基准上的分类和分割任务表现显著优于当前最先进的方法。该研究不仅在几何重建方面表现出色,还注重可靠的高级语义信息的获取,推动了三维点云技术在各种应用中的进步。
相关论文信息:https://doi.org/10.1016/j.patcog.2024.110690
版权声明:凡本网注明“来源:中国科学报、科学网、科学新闻杂志”的所有作品,网站转载,请在正文上方注明来源和作者,且不得对内容作实质性改动;微信公众号、头条号等新媒体平台,转载请联系授权。邮箱:shouquan@stimes.cn。