RepoLaunch: Automating Build&Test Pipeline of Code Repositories on ANY Language and ANY Platform

📄 arXiv: 2603.05026v1 📥 PDF

作者: Kenan Li, Rongzhi Li, Linghao Zhang, Qirui Jin, Liao Zhu, Xiaosong Huang, Geng Zhang, Yikai Zhang, Shilin He, Chengxing Xie, Xin Zhang, Zijian Jin, Bowen Li, Chaoyun Zhang, Yu Kang, Yufan Huang, Elsie Nallipogu, Saravan Rajmohan, Qingwei Lin, Dongmei Zhang

分类: cs.SE, cs.LG, cs.MA

发布日期: 2026-03-05

备注: Under peer review. 16 pages, 4 figures, 5 tables


💡 一句话要点

RepoLaunch:自动化任意语言和平台代码仓库的构建与测试流程

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 自动化构建 自动化测试 大型语言模型 软件工程 代码仓库

📋 核心要点

  1. 现有软件仓库构建流程依赖大量人工操作,效率低下且容易出错。
  2. RepoLaunch利用LLM Agent自动解决依赖、编译代码并提取测试结果,无需人工干预。
  3. RepoLaunch实现了全自动的软件工程数据集创建流程,可扩展地进行Agent基准测试和训练。

📝 摘要(中文)

软件仓库的构建通常需要大量的人工操作。大型语言模型(LLM)Agent的最新进展加速了软件工程(SWE)的自动化。我们推出了RepoLaunch,这是第一个能够自动解决依赖关系、编译源代码并提取任意编程语言和操作系统仓库的测试结果的Agent。为了展示它的实用性,我们进一步提出了一个完全自动化的SWE数据集创建流程,其中任务设计是唯一的人工干预。RepoLaunch可以自动化剩余步骤,从而实现编码Agent和LLM的可扩展基准测试和训练。值得注意的是,最近一些关于Agent基准测试和训练的工作已经采用了RepoLaunch来实现自动化的任务生成。

🔬 方法详解

问题定义:现有软件仓库的构建和测试流程高度依赖人工操作,需要手动解决依赖关系、配置编译环境、执行测试并分析结果。这不仅耗时耗力,而且容易出错,难以自动化和扩展。尤其是在面对不同编程语言和操作系统时,需要针对性地进行配置,增加了复杂性。

核心思路:RepoLaunch的核心思路是利用大型语言模型(LLM)Agent的强大能力,模拟人类软件工程师的行为,自动完成软件仓库的构建和测试流程。通过赋予Agent理解代码、解决依赖、编译执行和分析结果的能力,实现全自动化的软件工程流程。

技术框架:RepoLaunch的整体架构包含以下几个主要模块:1) 依赖解析模块:自动分析代码仓库的依赖关系,并找到合适的依赖包。2) 编译模块:根据代码仓库的编程语言和目标平台,自动配置编译环境并编译源代码。3) 测试模块:自动执行代码仓库中的测试用例,并收集测试结果。4) 结果分析模块:分析测试结果,提取关键信息,例如测试通过率、错误信息等。这些模块协同工作,形成一个完整的自动化构建和测试流程。

关键创新:RepoLaunch最重要的技术创新在于其能够处理任意编程语言和操作系统下的代码仓库。这得益于LLM Agent强大的泛化能力和对不同编程语言和工具的理解。与传统的自动化构建工具相比,RepoLaunch无需手动配置和编写脚本,可以自动适应不同的代码仓库。

关键设计:RepoLaunch的关键设计包括:1) 使用LLM Agent作为核心控制器,负责协调各个模块的工作。2) 设计了一套通用的API,用于与不同的编译工具和测试框架进行交互。3) 采用强化学习等技术,不断优化Agent的性能和效率。具体的参数设置、损失函数和网络结构等技术细节在论文中可能未详细公开,属于未知信息。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

RepoLaunch成功实现了对任意编程语言和操作系统代码仓库的自动化构建和测试,无需人工干预。该论文进一步提出了一个全自动的软件工程数据集创建流程,并已被多个Agent基准测试和训练工作采用,证明了其在自动化任务生成方面的有效性。具体的性能数据和提升幅度可能需要在相关工作中进一步考察。

🎯 应用场景

RepoLaunch可广泛应用于软件开发、持续集成、自动化测试等领域。它可以帮助开发者快速构建和测试代码仓库,提高开发效率和代码质量。此外,RepoLaunch还可以用于大规模的软件工程数据集创建,为机器学习和人工智能在软件工程领域的应用提供数据支持。未来,RepoLaunch有望成为软件开发流程中的一个重要组成部分,推动软件工程的自动化和智能化。

📄 摘要(原文)

Building software repositories typically requires significant manual effort. Recent advances in large language model (LLM) agents have accelerated automation in software engineering (SWE). We introduce RepoLaunch, the first agent capable of automatically resolving dependencies, compiling source code, and extracting test results for repositories across arbitrary programming languages and operating systems. To demonstrate its utility, we further propose a fully automated pipeline for SWE dataset creation, where task design is the only human intervention. RepoLaunch automates the remaining steps, enabling scalable benchmarking and training of coding agents and LLMs. Notably, several works on agentic benchmarking and training have recently adopted RepoLaunch for automated task generation.