PolyFit: A Peg-in-hole Assembly Framework for Unseen Polygon Shapes via Sim-to-real Adaptation

📄 arXiv: 2312.02531v1 📥 PDF

作者: Geonhyup Lee, Joosoon Lee, Sangjun Noh, Minhwan Ko, Kangmin Kim, Kyoobin Lee

分类: cs.RO, cs.AI

发布日期: 2023-12-05

备注: 8 pages, 8 figures, 3 tables


💡 一句话要点

PolyFit:基于力/力矩反馈的监督学习方法,解决复杂形状的孔轴配合问题

🎯 匹配领域: 支柱一:机器人控制 (Robot Control) 支柱二:RL算法与架构 (RL & Architecture)

关键词: 孔轴配合 机器人 监督学习 力/力矩控制 Sim-to-real 姿态估计 多边形形状

📋 核心要点

  1. 孔轴配合任务易受传感器误差和机械误差影响,导致传统方法难以应对复杂形状。
  2. PolyFit采用基于力/力矩的监督学习框架,通过模拟训练和sim-to-real自适应,实现高精度姿态估计。
  3. 实验表明,PolyFit在模拟和真实环境中均取得了优异的成功率,验证了其鲁棒性和泛化能力。

📝 摘要(中文)

本研究致力于解决机器人孔轴配合这一基础且具有挑战性的任务。传感器误差和机械误差导致的未对准通常会导致插入失败或卡死。本研究引入了PolyFit,通过从强化学习方法过渡到监督学习方法,实现范式转变。PolyFit是一个基于力/力矩(F/T)的监督学习框架,专为5自由度孔轴配合而设计。它利用F/T数据进行精确的外部姿态估计,并调整轴的姿态以纠正未对准。在模拟环境中进行了广泛的训练,数据集涵盖了各种轴孔形状、外部姿态以及相应的接触F/T读数。为了增强外部姿态估计,模型输入中集成了多点接触策略,因为相同的F/T读数可能指示不同的姿态。该研究提出了一种用于实际应用的sim-to-real自适应方法,使用sim-real配对数据集,从而能够有效地推广到复杂和未见过的多边形形状。PolyFit在模拟中对已见和未见形状分别实现了97.3%和96.3%的令人印象深刻的孔轴配合成功率。实际评估进一步证明了86.7%和85.0%的显著成功率,突出了所提出方法的鲁棒性和适应性。

🔬 方法详解

问题定义:论文旨在解决机器人孔轴配合中,由于传感器精度和机械误差导致的未对准问题,尤其是在面对复杂和未知的多边形孔轴形状时,传统方法难以保证配合的成功率和鲁棒性。现有方法,例如基于强化学习的方法,通常需要大量的试错学习,效率较低,且难以泛化到新的形状。

核心思路:PolyFit的核心思路是将孔轴配合问题转化为一个监督学习问题,通过力/力矩(F/T)传感器数据来估计轴的外部姿态,并调整轴的姿态以纠正未对准。通过在模拟环境中训练模型,并使用sim-to-real自适应方法,使模型能够泛化到真实世界的复杂形状。

技术框架:PolyFit框架主要包含以下几个阶段:1) 数据生成:在模拟环境中生成大量包含不同孔轴形状、外部姿态和对应接触力/力矩读数的数据集。2) 模型训练:使用监督学习方法,训练一个模型,该模型能够根据力/力矩数据估计轴的外部姿态。3) Sim-to-real自适应:使用sim-real配对数据集,对模型进行微调,使其能够适应真实世界的环境。4) 孔轴配合:使用训练好的模型,根据力/力矩传感器数据,实时调整轴的姿态,完成孔轴配合。

关键创新:PolyFit的关键创新在于:1) 将孔轴配合问题转化为一个监督学习问题,避免了强化学习的试错过程。2) 提出了一个基于力/力矩的姿态估计模型,能够精确地估计轴的外部姿态。3) 引入了多点接触策略,提高了姿态估计的准确性。4) 提出了一个sim-to-real自适应方法,使模型能够泛化到真实世界的复杂形状。与现有方法相比,PolyFit具有更高的效率、鲁棒性和泛化能力。

关键设计:在模型设计方面,PolyFit采用了多层感知机(MLP)作为姿态估计器的基础架构。损失函数主要包括姿态估计误差和力/力矩预测误差。Sim-to-real自适应采用了域对抗训练的思想,旨在减小模拟环境和真实环境之间的差异。多点接触策略通过在轴上选择多个接触点,并利用这些接触点的力/力矩信息,来提高姿态估计的准确性。具体参数设置(如学习率、网络层数等)未知。

📊 实验亮点

PolyFit在模拟环境中对已见和未见形状分别实现了97.3%和96.3%的孔轴配合成功率。在真实环境中,PolyFit对已见和未见形状分别实现了86.7%和85.0%的成功率。这些结果表明,PolyFit具有很强的鲁棒性和泛化能力,能够有效地解决复杂形状的孔轴配合问题。与未提及的基线方法相比,PolyFit取得了显著的性能提升。

🎯 应用场景

PolyFit在自动化装配、精密仪器制造、航空航天等领域具有广泛的应用前景。它可以提高装配效率、降低装配成本,并能够处理复杂形状的零件装配。未来,该技术有望应用于更复杂的机器人操作任务,例如柔性物体的操作和微纳操作。

📄 摘要(原文)

The study addresses the foundational and challenging task of peg-in-hole assembly in robotics, where misalignments caused by sensor inaccuracies and mechanical errors often result in insertion failures or jamming. This research introduces PolyFit, representing a paradigm shift by transitioning from a reinforcement learning approach to a supervised learning methodology. PolyFit is a Force/Torque (F/T)-based supervised learning framework designed for 5-DoF peg-in-hole assembly. It utilizes F/T data for accurate extrinsic pose estimation and adjusts the peg pose to rectify misalignments. Extensive training in a simulated environment involves a dataset encompassing a diverse range of peg-hole shapes, extrinsic poses, and their corresponding contact F/T readings. To enhance extrinsic pose estimation, a multi-point contact strategy is integrated into the model input, recognizing that identical F/T readings can indicate different poses. The study proposes a sim-to-real adaptation method for real-world application, using a sim-real paired dataset to enable effective generalization to complex and unseen polygon shapes. PolyFit achieves impressive peg-in-hole success rates of 97.3% and 96.3% for seen and unseen shapes in simulations, respectively. Real-world evaluations further demonstrate substantial success rates of 86.7% and 85.0%, highlighting the robustness and adaptability of the proposed method.