Query-Centric Diffusion Policy for Generalizable Robotic Assembly

📄 arXiv: 2509.18686v1 📥 PDF

作者: Ziyi Xu, Haohong Lin, Shiqi Liu, Ding Zhao

分类: cs.RO, cs.LG

发布日期: 2025-09-23

备注: 8 pages, 7 figures


💡 一句话要点

提出Query-centric Diffusion Policy,解决机器人装配中高层规划与底层控制的鸿沟

🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture)

关键词: 机器人装配 扩散策略 分层控制 点云观测 通用机器人 技能学习 查询机制

📋 核心要点

  1. 现有机器人装配方法在高层规划和底层控制之间存在鸿沟,导致技能查询与实际执行不匹配。
  2. Query-centric Diffusion Policy (QDP) 通过引入查询机制,利用对象、接触点和技能信息来指导低层策略。
  3. 在FurnitureBench的实验表明,QDP在技能精度和长期成功率方面均优于现有方法,尤其在插入和拧螺丝任务中提升显著。

📝 摘要(中文)

机器人装配任务由于零件交互的复杂性和接触环境中对噪声扰动的敏感性,对通用机器人提出了关键挑战。通常,装配代理以分层方式设计:高层多部件推理和低层精确控制。然而,由于高层技能查询和低层执行之间的不匹配,在实践中实现这种分层策略具有挑战性。为了解决这个问题,我们提出了Query-centric Diffusion Policy (QDP),这是一个分层框架,通过利用包含对象、接触点和技能信息的查询来桥接高层规划和低层控制。QDP引入了一种以查询为中心的机制,该机制识别任务相关的组件,并使用它们来指导低层策略,利用点云观测来提高策略的鲁棒性。我们在模拟和真实环境中的FurnitureBench上进行了全面的实验,证明了技能精度和长期成功率的提高。在具有挑战性的插入和拧螺丝任务中,与没有结构化查询的基线相比,QDP将技能成功率提高了50%以上。

🔬 方法详解

问题定义:机器人装配任务,特别是通用机器人装配,面临着零件之间复杂交互以及接触过程对噪声敏感的挑战。传统方法通常采用分层结构,即高层进行多部件推理,低层执行精确控制。然而,这种分层结构在高层技能查询和低层控制执行之间存在不匹配,导致实际应用困难。现有方法难以有效地将高层指令转化为精确的底层动作,从而限制了装配的成功率和泛化能力。

核心思路:论文的核心思路是引入“查询中心”的概念,通过结构化的查询信息(包含对象、接触点和技能信息)来弥合高层规划和低层控制之间的差距。这种查询机制能够明确地指导低层策略,使其关注任务相关的组件,并根据查询信息执行相应的动作。通过这种方式,高层指令能够更有效地传递到底层执行,从而提高装配的精度和成功率。

技术框架:QDP框架主要包含以下几个模块:1) 查询生成模块:负责生成包含对象、接触点和技能信息的结构化查询。2) 策略网络:基于扩散模型,根据查询信息和点云观测生成低层控制动作。3) 执行模块:将策略网络生成的动作应用于机器人,执行装配任务。整体流程是:首先,查询生成模块生成查询信息;然后,策略网络根据查询信息和环境观测生成动作;最后,执行模块执行动作,完成装配任务。

关键创新:QDP的关键创新在于其“查询中心”的设计。与传统方法直接将高层指令传递给低层控制不同,QDP通过结构化的查询信息,明确地指导低层策略,使其关注任务相关的组件。这种设计能够有效地弥合高层规划和低层控制之间的差距,提高装配的精度和成功率。此外,QDP利用点云观测来提高策略的鲁棒性,使其能够适应环境中的噪声和扰动。

关键设计:QDP使用扩散模型作为策略网络的核心。扩散模型能够生成高质量的控制动作,并且具有较强的鲁棒性。查询信息被编码成向量,作为扩散模型的条件输入。损失函数主要包括两部分:一是动作预测的均方误差损失,用于训练策略网络;二是正则化损失,用于约束查询信息的结构。具体的网络结构和参数设置根据具体的装配任务进行调整。

📊 实验亮点

实验结果表明,QDP在FurnitureBench数据集上取得了显著的性能提升。在模拟和真实环境中,QDP的技能精度和长期成功率均优于现有方法。在具有挑战性的插入和拧螺丝任务中,QDP的技能成功率比没有结构化查询的基线提高了50%以上。这些结果表明,QDP能够有效地弥合高层规划和低层控制之间的差距,提高机器人装配的性能。

🎯 应用场景

该研究成果可应用于各种需要精确操作的机器人装配任务,例如家具组装、电子产品制造、汽车零部件装配等。通过提高机器人装配的精度和效率,可以降低生产成本,提高产品质量,并实现自动化生产。未来,该技术有望扩展到更复杂的装配任务,例如航空航天器的组装和医疗设备的制造。

📄 摘要(原文)

The robotic assembly task poses a key challenge in building generalist robots due to the intrinsic complexity of part interactions and the sensitivity to noise perturbations in contact-rich settings. The assembly agent is typically designed in a hierarchical manner: high-level multi-part reasoning and low-level precise control. However, implementing such a hierarchical policy is challenging in practice due to the mismatch between high-level skill queries and low-level execution. To address this, we propose the Query-centric Diffusion Policy (QDP), a hierarchical framework that bridges high-level planning and low-level control by utilizing queries comprising objects, contact points, and skill information. QDP introduces a query-centric mechanism that identifies task-relevant components and uses them to guide low-level policies, leveraging point cloud observations to improve the policy's robustness. We conduct comprehensive experiments on the FurnitureBench in both simulation and real-world settings, demonstrating improved performance in skill precision and long-horizon success rate. In the challenging insertion and screwing tasks, QDP improves the skill-wise success rate by over 50% compared to baselines without structured queries.