Towards Automated Chicken Deboning via Learning-based Dynamically-Adaptive 6-DoF Multi-Material Cutting

📄 arXiv: 2510.15376v1 📥 PDF

作者: Zhaodong Yang, Ai-Ping Hu, Harish Ravichandar

分类: cs.RO

发布日期: 2025-10-17

备注: 8 Pages, 8 figures


💡 一句话要点

提出基于学习的动态自适应六自由度多材质切割方法,实现自动化鸡肩剔骨

🎯 匹配领域: 支柱一:机器人控制 (Robot Control) 支柱二:RL算法与架构 (RL & Architecture)

关键词: 鸡肩剔骨 自动化切割 强化学习 力反馈控制 多材质切割 模拟到真实 机器人

📋 核心要点

  1. 鸡肩剔骨自动化面临多材质、部分遮挡和易变形关节的挑战,现有方法难以精确控制刀具并避免骨骼损伤。
  2. 提出一种基于强化学习的力反馈切割策略,通过动态调整刀具轨迹和六自由度控制,实现在狭窄间隙中的安全切割。
  3. 构建了多材质切割模拟器和物理测试平台,实验表明该策略在真实鸡肩剔骨中成功率和骨骼避免率提升4倍。

📝 摘要(中文)

本文针对鸡肩剔骨自动化问题,提出了一种基于学习的反应式力反馈切割策略,该策略能够动态调整标称轨迹,并实现完整的六自由度刀具控制,从而在狭窄的关节间隙中穿行,同时避免与骨骼接触,降低健康和安全风险。本文在系统层面和算法层面均有贡献。首先,我们引入了一个开源的定制多材质切割模拟器,该模拟器对耦合、断裂和切割力进行建模,并支持强化学习,从而实现高效训练和快速原型设计。其次,我们设计了一个可重复使用的物理测试平台,用于模拟鸡肩:两个具有可控姿态的刚性“骨骼”球体嵌入在较软的块体中,从而实现严格和可重复的评估,同时保留目标问题的基本多材质特性。第三,我们训练并部署了一个残差强化学习策略,该策略具有离散化的力观测和领域随机化,从而实现鲁棒的零样本模拟到真实迁移,并首次演示了学习策略在真实鸡肩上的剔骨。在模拟器、物理测试平台和真实鸡肩上的实验表明,我们学习的策略能够可靠地导航关节间隙,并减少不希望的骨骼/软骨接触,在成功率和避免骨骼接触方面,比现有的开环切割基线提高了4倍。我们的结果还说明了力反馈对于安全有效的多材质切割的必要性。

🔬 方法详解

问题定义:鸡肩剔骨是一个复杂的多材质切割问题,涉及软组织、骨骼和软骨。现有方法,如开环切割,难以适应鸡肩的形状变化和不确定性,容易造成骨骼损伤,影响产品质量和食品安全。因此,需要一种能够精确控制刀具,并根据实时反馈动态调整切割轨迹的方法。

核心思路:本文的核心思路是利用强化学习训练一个能够根据力反馈动态调整切割轨迹的策略。通过力反馈,策略可以感知刀具与不同材质的接触情况,从而避免与骨骼碰撞,并在狭窄的关节间隙中安全切割。这种方法能够适应鸡肩的形状变化和不确定性,提高剔骨的成功率和安全性。

技术框架:该方法的技术框架主要包括三个部分:多材质切割模拟器、物理测试平台和强化学习策略。首先,构建一个多材质切割模拟器,用于生成大量的训练数据。然后,设计一个物理测试平台,用于验证策略的有效性和鲁棒性。最后,利用强化学习算法训练一个能够根据力反馈动态调整切割轨迹的策略。该策略将离散化的力观测作为输入,输出六自由度的刀具控制指令。

关键创新:本文的关键创新在于将强化学习和力反馈控制相结合,实现了一种能够动态适应多材质切割任务的策略。与传统的开环切割方法相比,该策略能够根据实时反馈调整切割轨迹,从而避免与骨骼碰撞,提高剔骨的成功率和安全性。此外,本文还构建了一个多材质切割模拟器和一个物理测试平台,为该领域的研究提供了重要的工具。

关键设计:在强化学习策略的设计中,采用了残差强化学习,以提高训练的稳定性和收敛速度。力观测被离散化,以降低状态空间的维度。同时,采用了领域随机化技术,以提高策略的鲁棒性和泛化能力。损失函数的设计目标是最大化切割成功率,同时最小化与骨骼的接触。

📊 实验亮点

实验结果表明,该方法在模拟器、物理测试平台和真实鸡肩上均取得了良好的效果。在真实鸡肩剔骨实验中,该策略的成功率和骨骼避免率比现有的开环切割基线提高了4倍。这表明该方法能够有效地解决鸡肩剔骨自动化问题,并具有很强的实际应用价值。

🎯 应用场景

该研究成果可应用于家禽加工业的自动化生产线,提高鸡肉产品的生产效率和质量,降低人工成本和安全风险。此外,该方法也可推广到其他多材质切割任务,如医疗手术机器人、食品加工等领域,具有广阔的应用前景和实际价值。未来,可以进一步研究如何将该方法应用于更复杂的切割任务,并提高策略的泛化能力。

📄 摘要(原文)

Automating chicken shoulder deboning requires precise 6-DoF cutting through a partially occluded, deformable, multi-material joint, since contact with the bones presents serious health and safety risks. Our work makes both systems-level and algorithmic contributions to train and deploy a reactive force-feedback cutting policy that dynamically adapts a nominal trajectory and enables full 6-DoF knife control to traverse the narrow joint gap while avoiding contact with the bones. First, we introduce an open-source custom-built simulator for multi-material cutting that models coupling, fracture, and cutting forces, and supports reinforcement learning, enabling efficient training and rapid prototyping. Second, we design a reusable physical testbed to emulate the chicken shoulder: two rigid "bone" spheres with controllable pose embedded in a softer block, enabling rigorous and repeatable evaluation while preserving essential multi-material characteristics of the target problem. Third, we train and deploy a residual RL policy, with discretized force observations and domain randomization, enabling robust zero-shot sim-to-real transfer and the first demonstration of a learned policy that debones a real chicken shoulder. Our experiments in our simulator, on our physical testbed, and on real chicken shoulders show that our learned policy reliably navigates the joint gap and reduces undesired bone/cartilage contact, resulting in up to a 4x improvement over existing open-loop cutting baselines in terms of success rate and bone avoidance. Our results also illustrate the necessity of force feedback for safe and effective multi-material cutting. The project website is at https://sites.google.com/view/chickendeboning-2026.