Teleoperator-Aware and Safety-Critical Adaptive Nonlinear MPC for Shared Autonomy in Obstacle Avoidance of Legged Robots

📄 arXiv: 2509.22815v1 📥 PDF

作者: Ruturaj Sambhus, Muneeb Ahmad, Basit Muhammad Imran, Sujith Vijayan, Dylan P. Losey, Kaveh Akbari Hamed

分类: cs.RO, math.OC

发布日期: 2025-09-26


💡 一句话要点

提出自适应非线性模型预测控制以解决四足机器人避障问题

🎯 匹配领域: 支柱一:机器人控制 (Robot Control)

关键词: 共享自主 四足机器人 避障 模型预测控制 人机协作 控制障碍函数 在线学习 动态建模

📋 核心要点

  1. 现有的共享控制方法往往依赖固定的混合策略,无法有效应对四足机器人在复杂环境中的动态行为,存在安全隐患。
  2. 本文提出了一种自适应非线性模型预测控制框架,结合遥控操作员的输入和控制障碍函数,增强了安全性和实时性。
  3. 通过在Unitree Go2四足机器人上进行广泛的数值和硬件实验,验证了该框架在实时避障和在线学习人类意图参数方面的有效性。

📝 摘要(中文)

确保人类与自主四足机器人之间的安全有效协作是共享自主中的基本挑战,尤其是在复杂环境中进行遥控操作时。传统的共享控制方法通常依赖于固定的混合策略,无法捕捉四足运动的动态特性,可能会影响安全性。本文提出了一种考虑遥控操作员的安全关键自适应非线性模型预测控制(ANMPC)框架,旨在解决四足机器人在避障任务中的共享自主问题。该框架通过建模人类输入并使用投影梯度下降法在线调整参数,增强了固定仲裁权重的方案。通过将控制障碍函数(CBF)约束集成到计算高效的NMPC中,确保了安全集的前向不变性,尽管存在人类行为的不确定性。

🔬 方法详解

问题定义:本文旨在解决遥控四足机器人在复杂环境中避障时的安全性和有效性问题。现有方法的痛点在于固定的混合策略无法适应动态变化,可能导致安全隐患。

核心思路:提出的自适应非线性模型预测控制(ANMPC)框架通过建模人类输入并在线调整参数,增强了对人类意图的理解,同时结合控制障碍函数确保安全性。

技术框架:该框架采用分层控制架构,包括高层CBF基础的ANMPC(10 Hz)生成混合速度参考,中层动态感知NMPC(60 Hz)跟踪这些参考,低层非线性全身控制器(500 Hz)通过二次规划实现全阶动态跟踪。

关键创新:最重要的技术创新在于将人类输入建模为带噪声的理性Boltzmann模型,并通过投影梯度下降法在线调整参数,从而实现了对人类意图的实时学习和适应。

关键设计:框架中的控制障碍函数(CBF)约束确保了安全集的前向不变性,且NMPC的计算效率得到了优化,适应了四足机器人的动态特性。具体的参数设置和损失函数设计在实验中进行了验证。

📊 实验亮点

实验结果表明,所提出的框架在实时避障任务中表现出色,能够有效学习人类意图参数,确保安全性。与基线方法相比,框架在避障成功率和响应时间上均有显著提升,具体性能数据未在摘要中提供。

🎯 应用场景

该研究的潜在应用领域包括人机协作机器人、救援机器人和服务机器人等。通过提高四足机器人在复杂环境中的安全性和有效性,该框架可以在实际应用中显著提升人机协作的效率和安全性,具有重要的实际价值和未来影响。

📄 摘要(原文)

Ensuring safe and effective collaboration between humans and autonomous legged robots is a fundamental challenge in shared autonomy, particularly for teleoperated systems navigating cluttered environments. Conventional shared-control approaches often rely on fixed blending strategies that fail to capture the dynamics of legged locomotion and may compromise safety. This paper presents a teleoperator-aware, safety-critical, adaptive nonlinear model predictive control (ANMPC) framework for shared autonomy of quadrupedal robots in obstacle-avoidance tasks. The framework employs a fixed arbitration weight between human and robot actions but enhances this scheme by modeling the human input with a noisily rational Boltzmann model, whose parameters are adapted online using a projected gradient descent (PGD) law from observed joystick commands. Safety is enforced through control barrier function (CBF) constraints integrated into a computationally efficient NMPC, ensuring forward invariance of safe sets despite uncertainty in human behavior. The control architecture is hierarchical: a high-level CBF-based ANMPC (10 Hz) generates blended human-robot velocity references, a mid-level dynamics-aware NMPC (60 Hz) enforces reduced-order single rigid body (SRB) dynamics to track these references, and a low-level nonlinear whole-body controller (500 Hz) imposes the full-order dynamics via quadratic programming to track the mid-level trajectories. Extensive numerical and hardware experiments, together with a user study, on a Unitree Go2 quadrupedal robot validate the framework, demonstrating real-time obstacle avoidance, online learning of human intent parameters, and safe teleoperator collaboration.