End-to-End Crop Row Navigation via LiDAR-Based Deep Reinforcement Learning
作者: Ana Luiza Mineiro, Francisco Affonso, Marcelo Becker
分类: cs.RO, cs.AI
发布日期: 2025-09-23 (更新: 2025-11-03)
备注: Accepted to the 22nd International Conference on Advanced Robotics (ICAR 2025). 7 pages
💡 一句话要点
提出基于LiDAR和深度强化学习的端到端作物行导航方法
🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture)
关键词: 作物行导航 LiDAR 深度强化学习 端到端学习 农业机器人
📋 核心要点
- 现有农业导航方法依赖GNSS,易受作物遮挡影响,且人工控制界面设计复杂。
- 提出一种端到端的深度强化学习方法,直接从LiDAR数据学习导航策略,无需人工干预。
- 实验表明,该方法在模拟环境中直线作物行导航成功率达100%,验证了其有效性。
📝 摘要(中文)
由于GNSS不可靠、作物行杂乱以及光照变化等因素,在作物冠层下的农业环境中实现可靠导航仍然是一个挑战。为了解决这些限制,我们提出了一种基于端到端学习的导航系统,该系统使用深度强化学习策略,直接将原始3D LiDAR数据映射到控制命令,并且完全在模拟环境中进行训练。我们的方法包括一种基于体素的降采样策略,该策略将LiDAR输入大小减少了95.83%,从而能够进行有效的策略学习,而无需依赖标记数据集或手动设计的控制界面。该策略已在模拟环境中进行了验证,在直线种植园中实现了100%的成功率,并且随着行曲率的增加,性能逐渐下降,并在不同的正弦频率和幅度下进行了测试。
🔬 方法详解
问题定义:论文旨在解决在复杂农业环境下,机器人或车辆如何仅通过LiDAR数据实现自主作物行导航的问题。现有方法依赖GNSS,但在作物冠层下信号弱,精度差。此外,传统控制方法需要人工设计控制规则,泛化性差。
核心思路:论文的核心思路是利用深度强化学习,直接从原始LiDAR数据中学习导航策略。通过端到端的方式,避免了人工特征提取和控制规则设计,提高了系统的鲁棒性和适应性。
技术框架:整体框架包括LiDAR数据采集、体素降采样、深度强化学习策略训练和导航控制四个主要阶段。首先,使用3D LiDAR传感器获取环境点云数据。然后,采用体素降采样方法减少数据量,提高计算效率。接着,利用深度强化学习算法训练导航策略,将LiDAR数据映射到控制命令。最后,将训练好的策略部署到机器人或车辆上,实现自主导航。
关键创新:最重要的技术创新点在于端到端的学习方式,直接从原始LiDAR数据学习导航策略,无需人工干预。此外,体素降采样策略显著减少了LiDAR数据的计算量,提高了学习效率。
关键设计:论文采用体素降采样将LiDAR输入数据量减少95.83%,显著提升了计算效率。深度强化学习部分,具体使用的算法(例如:DQN, PPO, SAC等)以及网络结构(例如:CNN, RNN等)在论文中未明确说明,属于未知信息。损失函数和奖励函数的设计对策略学习至关重要,但论文摘要中未提及具体细节,属于未知信息。
📊 实验亮点
该方法在模拟环境中进行了验证,在直线种植园中实现了100%的导航成功率。随着作物行曲率的增加,导航性能逐渐下降,表明该方法对复杂环境具有一定的适应性。体素降采样策略将LiDAR输入数据量减少了95.83%,显著提高了计算效率,为实时导航提供了可能。具体的性能数据,例如导航精度、速度等,以及对比的基线方法在摘要中未提及。
🎯 应用场景
该研究成果可应用于农业机器人、自动驾驶拖拉机等领域,实现精准农业作业,如自动喷洒农药、施肥、除草等。通过提高农业生产效率,降低人工成本,有望推动农业智能化发展,并提升农产品产量和质量。未来,该技术还可扩展到其他复杂环境下的自主导航任务。
📄 摘要(原文)
Reliable navigation in under-canopy agricultural environments remains a challenge due to GNSS unreliability, cluttered rows, and variable lighting. To address these limitations, we present an end-to-end learning-based navigation system that maps raw 3D LiDAR data directly to control commands using a deep reinforcement learning policy trained entirely in simulation. Our method includes a voxel-based downsampling strategy that reduces LiDAR input size by 95.83%, enabling efficient policy learning without relying on labeled datasets or manually designed control interfaces. The policy was validated in simulation, achieving a 100% success rate in straight-row plantations and showing a gradual decline in performance as row curvature increased, tested across varying sinusoidal frequencies and amplitudes.