Memory-Guided Point Cloud Completion for Dental Reconstruction

📄 arXiv: 2512.03598v1 📥 PDF

作者: Jianan Sun, Yukang Huang, Dongzhihan Wang, Mingyu Fan

分类: cs.CV

发布日期: 2025-12-03


💡 一句话要点

提出基于记忆引导的点云补全框架,用于牙科重建,提升补全精度。

🎯 匹配领域: 支柱三:空间感知 (Perception & SLAM)

关键词: 点云补全 牙科重建 记忆网络 原型学习 三维重建 深度学习 几何建模

📋 核心要点

  1. 牙科点云补全面临大面积缺失的挑战,现有方法依赖全局特征易产生偏差,导致补全效果不佳。
  2. 论文提出一种检索增强的框架,通过可学习的记忆模块提供结构先验,稳定缺失区域的推理,并释放解码器容量。
  3. 实验表明,该方法在Chamfer距离上取得了一致的改进,并能生成更清晰的牙齿细节,如牙尖和牙脊。

📝 摘要(中文)

针对牙科点云补全中,因遮挡和扫描视角限制导致的大面积缺失问题,现有方法依赖全局特征易产生偏差,解码器被迫生成幻构。本文提出一种检索增强的牙齿补全框架,将原型记忆集成到编码器-解码器流程中。该模型将部分输入编码为全局描述符后,从可学习的记忆中检索最近的流形原型,并通过置信度门控加权将其与查询特征融合,再进行解码。记忆模块端到端优化,自组织成可复用的牙齿形状原型,无需牙齿位置标签,从而提供结构先验,稳定缺失区域的推理,并释放解码器容量以恢复细节。该模块即插即用,兼容常见的补全骨干网络,并保持相同的训练损失。在自处理的Teeth3DS基准测试上的实验表明,Chamfer距离得到了一致的改进,可视化结果显示了更清晰的牙尖、牙脊和邻间过渡。该方法为利用交叉样本规律性,实现更准确、更真实的牙科点云补全提供了一种简单而有效的方法。

🔬 方法详解

问题定义:牙科点云补全任务中,由于扫描角度限制和遮挡,常常出现大面积的点云缺失。现有的点云补全方法在处理这种严重缺失情况时,容易受到不完整输入的影响,导致编码器提取的全局特征产生偏差,进而影响解码器的补全效果,产生不真实的结构或细节。

核心思路:论文的核心思路是引入一个可学习的“记忆”模块,该模块存储了多个牙齿形状的原型。在进行点云补全时,模型首先将不完整的输入点云编码成一个全局特征向量,然后从记忆模块中检索出最相似的牙齿原型,并将该原型信息融合到解码器中。这样,即使输入点云缺失严重,解码器也能利用原型信息进行更准确的补全。

技术框架:整体框架是一个标准的编码器-解码器结构,关键在于编码器和解码器之间插入了一个记忆模块。编码器负责提取输入点云的全局特征,记忆模块负责存储和检索牙齿原型,解码器负责根据编码器的输出和检索到的原型信息生成完整的点云。具体流程如下:1. 输入部分点云;2. 编码器提取全局特征;3. 记忆模块检索最相似的原型;4. 通过置信度门控加权融合全局特征和原型;5. 解码器生成完整点云。

关键创新:该方法最重要的创新点在于引入了可学习的记忆模块,并将其与编码器-解码器结构相结合。这个记忆模块能够自组织成多个牙齿形状的原型,从而为点云补全提供结构先验知识。与现有方法相比,该方法不需要额外的牙齿位置标签,并且能够更有效地利用交叉样本的规律性。

关键设计:记忆模块包含一组可学习的向量,每个向量代表一个牙齿原型。在训练过程中,这些向量通过端到端的方式进行优化,以学习到不同的牙齿形状。检索过程使用余弦相似度来衡量输入特征和原型之间的相似性。融合过程使用置信度门控加权,根据相似度动态调整原型信息的权重。损失函数与标准点云补全任务相同,例如Chamfer Distance。

📊 实验亮点

实验结果表明,该方法在自处理的Teeth3DS数据集上取得了显著的性能提升。与现有方法相比,该方法在Chamfer Distance指标上取得了一致的改进,并且能够生成更清晰的牙齿细节,例如牙尖、牙脊和邻间过渡。可视化结果也表明,该方法能够有效地补全大面积缺失的牙齿点云,生成更真实和自然的牙齿形状。

🎯 应用场景

该研究成果可应用于数字化口腔医疗领域,例如辅助牙科医生进行牙齿修复、正畸治疗和种植牙手术。通过更准确地补全缺失的牙齿点云,可以提高治疗方案的精度和效率,减少患者的痛苦和治疗时间。此外,该技术还可以应用于牙科教学和科研,例如用于生成逼真的牙齿模型和进行牙齿形态分析。

📄 摘要(原文)

Partial dental point clouds often suffer from large missing regions caused by occlusion and limited scanning views, which bias encoder-only global features and force decoders to hallucinate structures. We propose a retrieval-augmented framework for tooth completion that integrates a prototype memory into standard encoder--decoder pipelines. After encoding a partial input into a global descriptor, the model retrieves the nearest manifold prototype from a learnable memory and fuses it with the query feature through confidence-gated weighting before decoding. The memory is optimized end-to-end and self-organizes into reusable tooth-shape prototypes without requiring tooth-position labels, thereby providing structural priors that stabilize missing-region inference and free decoder capacity for detail recovery. The module is plug-and-play and compatible with common completion backbones, while keeping the same training losses. Experiments on a self-processed Teeth3DS benchmark demonstrate consistent improvements in Chamfer Distance, with visualizations showing sharper cusps, ridges, and interproximal transitions. Our approach provides a simple yet effective way to exploit cross-sample regularities for more accurate and faithful dental point-cloud completion.