MASFactory: A Graph-centric Framework for Orchestrating LLM-Based Multi-Agent Systems with Vibe Graphing

📄 arXiv: 2603.06007v1 📥 PDF

作者: Yang Liu, Jinxuan Cai, Yishen Li, Qi Meng, Zedi Liu, Xin Li, Chen Qian, Chuan Shi, Cheng Yang

分类: cs.CL, cs.AI, cs.MA

发布日期: 2026-03-06

备注: Submitted to ACL 2026 Demo Track. 10 pages, 6 figures. Code and documentation are available at: https://github.com/BUPT-GAMMA/MASFactory

🔗 代码/项目: GITHUB


💡 一句话要点

MASFactory:基于图结构的LLM多智能体系统编排框架,提升可复用性和可扩展性

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 多智能体系统 大语言模型 图结构 人机协作 工作流编排 Vibe Graphing 可重用组件 上下文集成

📋 核心要点

  1. 现有MAS框架在处理复杂图工作流时,需要大量人工干预,缺乏可重用性,且难以整合异构外部信息。
  2. MASFactory提出Vibe Graphing,将自然语言意图转化为可编辑和执行的图结构工作流,实现人机协作。
  3. 实验结果表明,MASFactory在多个基准测试中,能够保证方法的可复现性,并验证了Vibe Graphing的有效性。

📝 摘要(中文)

本文提出MASFactory,一个以图为中心的大语言模型(LLM)多智能体系统(MAS)编排框架。该框架通过角色专业化和协作来扩展智能体的问题解决能力。MAS工作流程可以自然地建模为有向计算图,其中节点执行智能体/子工作流程,边编码依赖关系和消息传递。然而,在现有框架中实现复杂的图工作流程仍然需要大量的人工工作,可重用性有限,并且难以集成异构的外部上下文源。为了克服这些限制,MASFactory引入了Vibe Graphing,这是一种人机协作方法,可以将自然语言意图编译成可编辑的工作流程规范,然后再编译成可执行的图。此外,该框架提供可重用组件和可插拔的上下文集成,以及用于拓扑预览、运行时跟踪和人机交互的可视化工具。在七个公共基准上评估了MASFactory,验证了代表性MAS方法的可复现一致性和Vibe Graphing的有效性。

🔬 方法详解

问题定义:现有基于LLM的多智能体系统在构建复杂工作流时面临诸多挑战。具体而言,手动设计和实现复杂的智能体交互图谱耗时费力,缺乏模块化设计导致代码复用率低,并且难以将外部知识和上下文信息有效集成到智能体系统中。这些问题限制了多智能体系统在实际应用中的扩展性和灵活性。

核心思路:MASFactory的核心思路是将多智能体系统的工作流程建模成图结构,并引入Vibe Graphing方法,允许用户使用自然语言描述意图,系统自动将其编译成可执行的图。这种图结构的设计使得工作流程更加清晰、模块化,易于编辑和重用。同时,框架提供可插拔的上下文集成机制,方便引入外部知识。

技术框架:MASFactory主要包含以下几个核心模块:1) Vibe Graphing模块:负责将自然语言意图转化为可编辑的工作流程图;2) 可重用组件库:提供预定义的智能体和子工作流程,方便用户快速构建系统;3) 上下文集成模块:允许用户将外部知识和数据源集成到智能体系统中;4) 可视化工具:提供拓扑预览、运行时跟踪和人机交互功能,方便用户监控和调试系统。整体流程是从自然语言意图开始,经过Vibe Graphing编译成图,然后利用可重用组件和上下文信息构建完整的MAS,最后通过可视化工具进行监控和调试。

关键创新:MASFactory的关键创新在于Vibe Graphing方法,它将自然语言意图作为输入,自动生成可执行的图结构工作流程。这种方法极大地降低了构建复杂多智能体系统的门槛,提高了开发效率。此外,框架的可重用组件和可插拔上下文集成机制也增强了系统的灵活性和可扩展性。

关键设计:Vibe Graphing的具体实现细节未知,论文中可能没有详细描述其内部的编译算法和优化策略。框架中可重用组件的具体类型和接口规范也未知。上下文集成模块的具体实现方式,例如如何处理不同数据源的格式和语义差异,也需要进一步研究。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

MASFactory在七个公共基准测试中进行了评估,验证了其在复现现有MAS方法方面的能力。实验结果表明,MASFactory能够有效地将自然语言意图转化为可执行的图结构工作流程,并提升多智能体系统的性能。具体的性能提升数据和对比基线需要在论文中查找。

🎯 应用场景

MASFactory可应用于各种需要多智能体协作的场景,例如:自动化客服、智能投顾、供应链管理、协同设计等。该框架降低了多智能体系统的开发门槛,使得开发者能够更快速地构建和部署复杂的智能体应用,从而提升工作效率和决策质量。未来,该框架有望推动多智能体技术在更多领域的应用。

📄 摘要(原文)

Large language model-based (LLM-based) multi-agent systems (MAS) are increasingly used to extend agentic problem solving via role specialization and collaboration. MAS workflows can be naturally modeled as directed computation graphs, where nodes execute agents/sub-workflows and edges encode dependencies and message passing. However, implementing complex graph workflows in current frameworks still requires substantial manual effort, offers limited reuse, and makes it difficult to integrate heterogeneous external context sources. To overcome these limitations, we present MASFactory, a graph-centric framework for orchestrating LLM-based MAS. It introduces Vibe Graphing, a human-in-the-loop approach that compiles natural-language intent into an editable workflow specification and then into an executable graph. In addition, the framework provides reusable components and pluggable context integration, as well as a visualizer for topology preview, runtime tracing, and human-in-the-loop interaction. We evaluate MASFactory on seven public benchmarks, validating both reproduction consistency for representative MAS methods and the effectiveness of Vibe Graphing. Our code (https://github.com/BUPT-GAMMA/MASFactory) and video (https://youtu.be/ANynzVfY32k) are publicly available.