YOLO and SGBM Integration for Autonomous Tree Branch Detection and Depth Estimation in Radiata Pine Pruning Applications

📄 arXiv: 2512.05412v1 📥 PDF

作者: Yida Lin, Bing Xue, Mengjie Zhang, Sam Schofield, Richard Green

分类: cs.CV

发布日期: 2025-12-05


💡 一句话要点

提出YOLO与SGBM融合框架,用于辐射松修剪中树枝的自主检测与深度估计

🎯 匹配领域: 支柱三:空间感知 (Perception & SLAM)

关键词: YOLO SGBM 立体视觉 目标检测 深度估计 自主修剪 辐射松 无人机

📋 核心要点

  1. 人工修剪辐射松树存在严重安全风险,工作高度高且地形复杂,亟需自动化解决方案。
  2. 该论文提出YOLO与SGBM融合的框架,利用立体视觉实现树枝检测和深度估计,无需激光雷达。
  3. 实验结果表明,该系统在树枝分割方面优于Mask R-CNN,且能在2米内精确定位树枝,处理速度快。

📝 摘要(中文)

本文提出了一种计算机视觉框架,该框架集成了YOLO目标检测和半全局块匹配(SGBM)立体视觉,用于基于无人机的自主修剪作业。该系统仅使用立体相机输入即可实现精确的树枝检测和深度估计,无需昂贵的激光雷达传感器。实验评估表明,YOLO的性能优于Mask R-CNN,在树枝分割方面实现了82.0%的mAPmask50-95。集成系统在2米的操作范围内精确定位树枝,每帧处理时间不到一秒。这些结果确立了经济高效的自主修剪系统的可行性,该系统可提高商业林业中工人的安全性和运营效率。

🔬 方法详解

问题定义:论文旨在解决辐射松人工修剪中存在的安全风险和效率问题。现有方法依赖人工操作,在高空和复杂地形下作业风险高。使用激光雷达虽然可以实现自动化,但成本过高,难以大规模应用。因此,需要一种低成本、高精度的树枝检测和深度估计方法,以实现自主修剪。

核心思路:论文的核心思路是利用YOLO目标检测算法进行树枝的精确分割,并结合SGBM立体匹配算法进行深度估计。YOLO算法具有速度快、精度高的优点,适合实时处理。SGBM算法是一种鲁棒的立体匹配算法,能够提供准确的深度信息。通过将两者结合,可以在低成本的立体相机基础上实现高精度的树枝定位。

技术框架:整体框架包括以下几个主要步骤:1) 使用立体相机获取左右图像;2) 使用YOLO目标检测算法对左右图像中的树枝进行分割;3) 使用SGBM算法对左右图像进行立体匹配,生成视差图;4) 根据视差图和相机参数计算树枝的深度信息;5) 将树枝的分割结果和深度信息进行融合,实现树枝的3D定位。

关键创新:论文的关键创新在于将YOLO目标检测算法和SGBM立体匹配算法相结合,用于树枝的自主检测和深度估计。这种方法无需昂贵的激光雷达传感器,降低了成本。此外,论文还针对树枝的特点对YOLO算法进行了优化,提高了分割精度。

关键设计:YOLO部分使用了预训练的YOLOv5模型,并使用辐射松树枝数据集进行了微调。SGBM算法使用了默认参数,但对视差图进行了后处理,以去除噪声和提高精度。损失函数使用了标准的交叉熵损失函数和Dice损失函数,以提高分割精度。网络结构方面,YOLOv5使用了CSPDarknet53作为骨干网络,并使用了PANet进行特征融合。

📊 实验亮点

实验结果表明,YOLO在树枝分割方面优于Mask R-CNN,实现了82.0%的mAPmask50-95。集成系统在2米的操作范围内精确定位树枝,每帧处理时间不到一秒。这些结果表明,该系统具有较高的精度和实时性,可以满足自主修剪的需求。

🎯 应用场景

该研究成果可应用于商业林业中的自主修剪作业,提高工人的安全性和运营效率。通过无人机搭载立体相机和自主修剪系统,可以实现对辐射松等树木的自动化修剪,降低人工成本,提高修剪质量。此外,该技术还可以扩展到其他农业领域,如水果采摘、作物管理等。

📄 摘要(原文)

Manual pruning of radiata pine trees poses significant safety risks due to extreme working heights and challenging terrain. This paper presents a computer vision framework that integrates YOLO object detection with Semi-Global Block Matching (SGBM) stereo vision for autonomous drone-based pruning operations. Our system achieves precise branch detection and depth estimation using only stereo camera input, eliminating the need for expensive LiDAR sensors. Experimental evaluation demonstrates YOLO's superior performance over Mask R-CNN, achieving 82.0% mAPmask50-95 for branch segmentation. The integrated system accurately localizes branches within a 2 m operational range, with processing times under one second per frame. These results establish the feasibility of cost-effective autonomous pruning systems that enhance worker safety and operational efficiency in commercial forestry.