Stoch BiRo: Design and Control of a low cost bipedal robot

📄 arXiv: 2312.06512v1 📥 PDF

作者: GVS Mothish, Karthik Rajgopal, Ravi Kola, Manan Tayal, Shishir Kolathaya

分类: cs.RO

发布日期: 2023-12-11

备注: 7 Pages, 6 figures


💡 一句话要点

Stoch BiRo:一种低成本、模块化、基于学习的足式双足机器人设计与控制方案

🎯 匹配领域: 支柱一:机器人控制 (Robot Control)

关键词: 双足机器人 步态控制 强化学习 低成本设计 模块化结构

📋 核心要点

  1. 现有双足机器人通常依赖高自由度设计和复杂的环境感知,成本高昂且泛化性受限,难以适应未知地形。
  2. Stoch BiRo采用低成本模块化设计,结合基于学习的线性策略控制器,仅需少量自由度即可实现稳健的平衡和运动控制。
  3. 通过MuJoCo仿真训练,策略成功迁移到真实机器人硬件,验证了其在未知地形下的自主导航能力和成本效益。

📝 摘要(中文)

本文介绍了一种低成本的双足机器人Stoch BiRo,它采用模块化机械结构和点状足部设计,能够在不平坦和未知的地形中导航。该机器人利用本体感受驱动来实现外展、髋部和膝部的运动,并使用Raspberry Pi4进行控制。为了克服计算限制,采用了一种基于学习的线性策略控制器,仅使用每条腿3个自由度(DoF)来管理平衡和运动,这与典型的双足系统中的5个自由度不同。这些控制器集成在一个模块化控制架构中,无需外部传感器或先验环境知识,即可自主处理不可预见的地形干扰。机器人的策略在MuJoCo中进行训练和仿真,并将学习到的行为转移到Stoch BiRo硬件上进行初步的行走验证。这项工作突出了Stoch BiRo在机械设计、控制策略和自主导航方面的适应性和成本效益,有望在现实世界的机器人应用中发挥多样化的作用。

🔬 方法详解

问题定义:现有双足机器人通常需要复杂的感知系统和高自由度的控制,导致成本高、计算量大,并且难以适应未知的复杂地形。如何在计算资源有限的情况下,设计一种低成本、高鲁棒性的双足机器人,使其能够在未知地形中稳定行走,是一个重要的挑战。

核心思路:本文的核心思路是采用模块化的机械设计,降低机器人的复杂度和成本。同时,利用基于学习的线性策略控制器,在有限的自由度下实现有效的平衡和运动控制。通过仿真训练,将学习到的策略迁移到真实机器人上,从而实现自主导航。

技术框架:Stoch BiRo的整体架构包括以下几个主要模块:1) 模块化的机械结构,采用点状足部设计,简化了足部与地面的接触模型;2) 本体感受驱动系统,利用电机和编码器获取关节角度信息;3) 基于Raspberry Pi4的控制系统,负责策略的执行和数据处理;4) 基于学习的线性策略控制器,通过仿真训练得到最优的控制策略。整个流程是先在MuJoCo中进行仿真训练,然后将训练好的策略部署到真实机器人上进行验证。

关键创新:本文最重要的技术创新点在于:1) 采用低自由度的控制策略(每条腿3个自由度),降低了计算复杂度,使得在计算资源有限的平台上也能实现有效的控制;2) 利用基于学习的线性策略控制器,能够自主学习适应不同地形的行走策略,无需人工设计复杂的控制规则;3) 模块化的机械设计降低了成本,提高了机器人的可维护性。

关键设计:在控制器的设计上,采用了线性二次型调节器(LQR)作为基础控制器,并通过强化学习算法(具体算法未知)进行优化,以适应不同的地形。损失函数的设计可能包括平衡误差、速度误差和能量消耗等。具体的参数设置和网络结构在论文中可能没有详细描述,属于未知信息。

📊 实验亮点

论文通过仿真和真实机器人实验验证了Stoch BiRo的性能。在MuJoCo仿真中,机器人能够稳定地在不同地形上行走。初步的硬件实验表明,通过仿真训练得到的策略可以成功迁移到真实机器人上,实现基本的行走功能。虽然论文中没有给出具体的性能数据和对比基线,但实验结果表明Stoch BiRo具有良好的适应性和鲁棒性。

🎯 应用场景

Stoch BiRo具有广泛的应用前景,包括:1) 搜救任务,能够在复杂地形中搜索幸存者;2) 物流配送,在仓库或户外环境中进行物品运输;3) 农业巡检,在农田中进行作物监测和数据采集;4) 教育科研,作为低成本的双足机器人平台,用于研究机器人控制、强化学习等领域。该研究有望推动双足机器人在实际场景中的应用。

📄 摘要(原文)

This paper introduces the Stoch BiRo, a cost-effective bipedal robot designed with a modular mechanical structure having point feet to navigate uneven and unfamiliar terrains. The robot employs proprioceptive actuation in abduction, hips, and knees, leveraging a Raspberry Pi4 for control. Overcoming computational limitations, a Learning-based Linear Policy controller manages balance and locomotion with only 3 degrees of freedom (DoF) per leg, distinct from the typical 5DoF in bipedal systems. Integrated within a modular control architecture, these controllers enable autonomous handling of unforeseen terrain disturbances without external sensors or prior environment knowledge. The robot's policies are trained and simulated using MuJoCo, transferring learned behaviors to the Stoch BiRo hardware for initial walking validations. This work highlights the Stoch BiRo's adaptability and cost-effectiveness in mechanical design, control strategies, and autonomous navigation, promising diverse applications in real-world robotics scenarios.