Interaction-Aware Whole-Body Control for Compliant Object Transport
作者: Hao Zhang, Yves Tseng, Ding Zhao, H. Eric Tseng
分类: cs.RO, cs.AI
发布日期: 2026-03-04
💡 一句话要点
提出交互导向全身控制,解决人型机器人在复杂环境中协同搬运的难题。
🎯 匹配领域: 支柱一:机器人控制 (Robot Control) 支柱二:RL算法与架构 (RL & Architecture)
关键词: 全身控制 人型机器人 协同搬运 强化学习 师生蒸馏 交互控制 机器人平衡
📋 核心要点
- 现有全身控制在复杂环境中协同搬运时,由于强烈的、时变的交互力,尤其是在近距离支撑任务中,可靠性降低。
- 提出一种交互导向的全身控制(IO-WBC),分离上肢交互和下肢支撑,通过强化学习策略控制身体响应。
- 实验表明,IO-WBC即使在速度跟踪不可行时也能保持稳定的全身行为和物理交互,实现顺从的对象传输。
📝 摘要(中文)
本文提出了一种受生物启发的、交互导向的全身控制(IO-WBC)方法,该方法类似于人工小脑,作为一个自适应的运动代理,将上游(技能级别)命令转化为接触状态下稳定且物理一致的全身行为。该方法在结构上将上肢交互执行与下肢支撑控制分离,使机器人能够在塑造紧密耦合的机器人-物体系统的力交换的同时保持平衡。轨迹优化的参考生成器(RG)提供运动学先验,而强化学习(RL)策略控制重载交互和扰动下的身体响应。该策略在模拟环境中进行训练,有效载荷质量/惯性和外部扰动是随机的,并通过非对称的师生蒸馏进行部署,因此学生在运行时仅依赖于本体感受历史。大量实验表明,即使精确的速度跟踪变得不可行,IO-WBC也能保持稳定的全身行为和物理交互,从而能够在各种场景中进行顺从的对象传输。
🔬 方法详解
问题定义:现有的人形机器人全身控制方法在非结构化环境中进行协同对象搬运时,面临着由强烈的、时变的交互力带来的挑战。尤其是在近距离支撑任务中,传统的以轨迹跟踪为中心的全身控制方法变得不可靠,难以保证机器人的平衡和稳定的交互。
核心思路:本文的核心思路是将全身控制分解为上肢交互执行和下肢支撑控制两个部分,并利用强化学习来学习在重载交互和扰动下的身体响应。这种分离使得机器人能够在塑造机器人-物体系统的力交换的同时,保持自身的平衡。同时,借鉴生物小脑的结构,将IO-WBC设计为一个自适应的运动代理,将高层指令转化为稳定的全身行为。
技术框架:该方法的整体框架包括三个主要模块:轨迹优化的参考生成器(RG)、交互导向的全身控制器(IO-WBC)和强化学习(RL)策略。RG提供运动学先验,IO-WBC负责将上肢交互执行与下肢支撑控制分离,RL策略则用于学习在重载交互和扰动下的身体响应。RL策略在模拟环境中进行训练,并通过非对称的师生蒸馏部署到真实机器人上。
关键创新:该方法最重要的创新点在于将全身控制分解为上肢交互执行和下肢支撑控制,并利用强化学习来学习身体响应。这种分解使得机器人能够更好地处理复杂的交互力,并保持自身的平衡。此外,使用非对称师生蒸馏,使得学生网络仅依赖于本体感受信息,更适合在真实机器人上部署。
关键设计:在强化学习训练中,使用了随机化的有效载荷质量/惯性和外部扰动,以提高策略的鲁棒性。非对称师生蒸馏中,教师网络使用更丰富的状态信息,而学生网络仅使用本体感受历史,以适应真实机器人的传感器限制。损失函数的设计需要平衡跟踪精度、力控制和平衡约束。
🖼️ 关键图片
📊 实验亮点
实验结果表明,IO-WBC即使在精确速度跟踪不可行的情况下,也能保持稳定的全身行为和物理交互。通过与传统的全身控制方法进行对比,IO-WBC在处理重载和外部扰动时表现出更强的鲁棒性和适应性,能够实现更顺畅、更安全的物体搬运。
🎯 应用场景
该研究成果可应用于辅助机器人、医疗康复机器人、工业协作机器人等领域。通过提升机器人在复杂环境中的协同搬运能力,可以减轻人类的体力劳动负担,提高工作效率,并为老年人和残疾人提供更好的生活辅助。
📄 摘要(原文)
Cooperative object transport in unstructured environments remains challenging for assistive humanoids because strong, time-varying interaction forces can make tracking-centric whole-body control unreliable, especially in close-contact support tasks. This paper proposes a bio-inspired, interaction-oriented whole-body control (IO-WBC) that functions as an artificial cerebellum - an adaptive motor agent that translates upstream (skill-level) commands into stable, physically consistent whole-body behavior under contact. This work structurally separates upper-body interaction execution from lower-body support control, enabling the robot to maintain balance while shaping force exchange in a tightly coupled robot-object system. A trajectory-optimized reference generator (RG) provides a kinematic prior, while a reinforcement learning (RL) policy governs body responses under heavy-load interactions and disturbances. The policy is trained in simulation with randomized payload mass/inertia and external perturbations, and deployed via asymmetric teacher-student distillation so that the student relies only on proprioceptive histories at runtime. Extensive experiments demonstrate that IO-WBC maintains stable whole-body behavior and physical interaction even when precise velocity tracking becomes infeasible, enabling compliant object transport across a wide range of scenarios.