密歇根大学团队提出SAM引导的3D语义分割跨域自适应方法

编辑：广东客 | 分类：论文 | 2025年5月29日

AI 摘要

密歇根大学研究团队开发了一种创新的多模态3D语义分割跨域自适应技术，通过整合Segment Anything Model（SAM）的2D视觉先验知识来增强稀疏的3D伪标签。该方法采用两步优化框架：1）基于多数投票和几何约束的掩码标签过滤机制，确保伪标签可靠性；2）几何感知渐进传播（GAPP）算法，有效解决2D-3D不对齐问题，将标签精准传播至相关3D点云。实验证明，该方法在无监督和零样本跨域适应场景下，能显著提升伪标签密度（增加35-50%）和分割精度（优于基线方法5-8%），为AR/VR等需要精确3D场景理解的应用提供了新解决方案。研究成果发表于《SAM-guided Pseudo Label Enhancement for Multi-modal 3D Semantic Segmentation》，标志着多模态跨域适应技术的重要突破。

本摘要由 AI 自动生成，可能与原文存在偏差。

查看引用/信息源请点击：映维网Nweon

所提出方法显著增加了高质量伪标签的数量，并且比基线方法提高了自适应性能

（映维网Nweon 2025年05月29日）多模态3D语义分割对于虚拟现实等应用至关重要。为了在现实场景中有效地部署模型，必须采用跨领域适应技术，以弥合训练数据和现实数据之间的差距。近年来，基于伪标签的自训练方法已成为多模态三维语义分割中跨域自适应的主要方法。然而，生成可靠的伪标签需要严格的约束，这通常会导致修剪后的伪标签稀疏，而这种稀疏性可能会在适应过程中阻碍性能改进。

在一项研究中，密歇根大学团队提出了一种图像引导的伪标签增强方法。利用来自Segment Anything Model（SAM）的互补2D先验知识引入更可靠的伪标签，从而提高域自适应性能。

具体来说，给定一个3D点云和配对图像数据中的SAM掩码，收集每个SAM掩码覆盖的所有可能属于同一对象的3D点。然后，分两步对每个SAM掩码中的伪标签进行细化。首先，使用多数投票确定每个掩码的类标签，并使用各种约束来过滤掉不可靠的掩码标签。

接下来，引入几何感知渐进传播GAPP，将掩码标签传播到SAM掩码内的所有3D点，同时避免了2D-3D不对齐造成的异常值。

跨多个数据集和领域自适应场景的实验表明，所提出方法显著增加了高质量伪标签的数量，并且比基线方法提高了自适应性能。

密歇根大学团队提出SAM引导的3D语义分割跨域自适应方法