Guiding Data Collection via Factored Scaling Curves

📄 arXiv: 2505.07728v1 📥 PDF

作者: Lihan Zha, Apurva Badithela, Michael Zhang, Justin Lidard, Jeremy Bao, Emily Zhou, David Snyder, Allen Z. Ren, Dhruv Shah, Anirudha Majumdar

分类: cs.RO, cs.AI, cs.LG

发布日期: 2025-05-12

备注: Project website: https://factored-data-scaling.github.io


💡 一句话要点

提出基于分解缩放曲线的数据收集指导方法以提升模仿学习效果

🎯 匹配领域: 支柱一:机器人控制 (Robot Control) 支柱二:RL算法与架构 (RL & Architecture)

关键词: 模仿学习 数据收集 分解缩放曲线 环境适应 机器人操作 智能制造 性能优化

📋 核心要点

  1. 现有的模仿学习策略在不同环境条件下的泛化能力不足,全面收集数据的成本过高。
  2. 本文提出通过分解缩放曲线(FSC)来指导数据收集,量化政策性能与数据规模的关系。
  3. 实验结果显示,该方法在新环境中的成功率比传统策略提高了最多26%。

📝 摘要(中文)

通用模仿学习策略在大规模数据集上训练显示出解决多样化操作任务的良好前景。然而,为了确保在不同条件下的泛化能力,策略需要在大量环境因素变化下收集数据,这是一项成本高昂的任务。本文提出了一种原则性的方法,通过构建分解缩放曲线(FSC),量化政策性能如何随着单个或成对因素的数据规模变化。这些曲线使得在给定预算内针对最具影响力的因素组合进行有针对性的数据获取成为可能。通过广泛的模拟和真实世界实验评估该方法,结果表明在新环境中的成功率比现有数据收集策略提高了多达26%。

🔬 方法详解

问题定义:本文旨在解决模仿学习策略在不同环境条件下泛化能力不足的问题。现有方法往往需要全面收集大量数据,成本高昂且效率低下。

核心思路:提出分解缩放曲线(FSC)的方法,通过量化政策性能与数据规模的关系,指导数据收集的优先级和数量,以优化数据获取过程。

技术框架:整体流程包括数据收集的初步分析、构建分解缩放曲线、确定优先级因素组合以及实施数据收集。主要模块包括数据分析模块、曲线构建模块和数据获取模块。

关键创新:最重要的创新在于引入了分解缩放曲线这一概念,使得在预算限制下能够有效识别和收集对政策性能影响最大的因素组合,与现有方法相比,显著提高了数据收集的效率。

关键设计:在参数设置上,FSC的构建依赖于对不同因素组合的性能评估,损失函数设计考虑了多因素影响的综合性,网络结构则采用了适应性调整的策略以应对不同环境条件的变化。

📊 实验亮点

实验结果表明,使用分解缩放曲线指导的数据收集方法在新环境中的成功率比现有策略提高了最多26%。这一显著提升证明了该方法在实际应用中的有效性和优越性。

🎯 应用场景

该研究的潜在应用领域包括机器人操作、自动驾驶、智能制造等需要在多变环境中进行高效决策的场景。通过优化数据收集策略,可以显著降低训练成本,提高模型在实际应用中的表现和适应能力,具有重要的实际价值和未来影响。

📄 摘要(原文)

Generalist imitation learning policies trained on large datasets show great promise for solving diverse manipulation tasks. However, to ensure generalization to different conditions, policies need to be trained with data collected across a large set of environmental factor variations (e.g., camera pose, table height, distractors) $-$ a prohibitively expensive undertaking, if done exhaustively. We introduce a principled method for deciding what data to collect and how much to collect for each factor by constructing factored scaling curves (FSC), which quantify how policy performance varies as data scales along individual or paired factors. These curves enable targeted data acquisition for the most influential factor combinations within a given budget. We evaluate the proposed method through extensive simulated and real-world experiments, across both training-from-scratch and fine-tuning settings, and show that it boosts success rates in real-world tasks in new environments by up to 26% over existing data-collection strategies. We further demonstrate how factored scaling curves can effectively guide data collection using an offline metric, without requiring real-world evaluation at scale.