GenDB: The Next Generation of Query Processing -- Synthesized, Not Engineered

📄 arXiv: 2603.02081v1 📥 PDF

作者: Jiale Lao, Immanuel Trummer

分类: cs.DB, cs.AI, cs.CL, cs.LG, cs.MA

发布日期: 2026-03-02


💡 一句话要点

GenDB:利用LLM合成查询执行代码,革新传统数据库查询处理。

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 大型语言模型 查询处理 代码生成 数据库系统 OLAP 多智能体系统 自适应优化

📋 核心要点

  1. 现有查询处理引擎难以适应快速变化的需求,扩展困难且开发成本高昂。
  2. GenDB利用LLM为每个查询合成定制的执行代码,避免了复杂引擎的维护。
  3. 实验表明,GenDB在OLAP工作负载上优于DuckDB、Umbra等先进查询引擎。

📝 摘要(中文)

传统查询处理依赖于专家精心优化和设计的引擎。然而,新技术和用户需求快速演变,现有系统往往无法跟上。同时,由于其内部复杂性,这些系统难以扩展,开发新系统需要大量的工程努力和成本。本文提出,大型语言模型(LLM)的最新进展正在塑造下一代查询处理系统。我们建议使用LLM为每个传入的查询合成执行代码,而不是持续构建、扩展和维护复杂的查询处理引擎。作为概念验证,我们提出了GenDB,一个由LLM驱动的智能体系统,它生成针对特定数据、工作负载和硬件资源定制的实例优化和定制的查询执行代码。我们实现了一个GenDB的早期原型,它使用Claude Code Agent作为多智能体系统的底层组件,并在OLAP工作负载上对其进行评估。我们使用来自著名的TPC-H基准测试的查询,并构建了一个新的基准测试,旨在减少LLM训练数据中潜在的数据泄露。我们将GenDB与最先进的查询引擎(包括DuckDB、Umbra、MonetDB、ClickHouse和PostgreSQL)进行比较。GenDB的性能明显优于这些系统。最后,我们讨论了GenDB当前的局限性,并概述了未来的扩展和相关的研究挑战。

🔬 方法详解

问题定义:传统数据库查询处理引擎依赖于人工设计和优化,难以适应快速变化的需求和硬件环境。现有引擎的复杂性使得扩展和维护成本高昂,并且难以针对特定数据和工作负载进行定制优化。数据泄露也是一个潜在问题,尤其是在使用LLM时。

核心思路:利用大型语言模型(LLM)的代码生成能力,为每个传入的查询动态合成定制的执行代码。这种方法避免了构建和维护复杂的通用查询处理引擎,而是针对特定实例进行优化,从而提高性能和灵活性。

技术框架:GenDB是一个基于LLM的多智能体系统。它接收查询作为输入,利用LLM生成相应的查询执行代码,然后在目标硬件上执行。该系统包含多个智能体,例如代码生成智能体、优化智能体和执行智能体。Claude Code Agent是底层组件,负责代码生成。

关键创新:GenDB的核心创新在于使用LLM动态生成查询执行代码,而不是依赖于预先构建的查询处理引擎。这种方法允许针对特定数据、工作负载和硬件资源进行定制优化,从而实现更高的性能。此外,GenDB还引入了一种新的基准测试,旨在减少LLM训练数据中潜在的数据泄露。

关键设计:GenDB的关键设计包括LLM的选择(Claude Code Agent)、多智能体系统的架构以及代码生成和优化策略。具体的参数设置和损失函数等技术细节在论文中没有详细描述,属于未知信息。代码生成过程可能涉及提示工程(Prompt Engineering),以引导LLM生成高质量的查询执行代码。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

GenDB在OLAP工作负载上进行了评估,并与DuckDB、Umbra、MonetDB、ClickHouse和PostgreSQL等先进查询引擎进行了比较。实验结果表明,GenDB的性能明显优于这些系统,证明了基于LLM的查询处理方法的有效性。具体性能提升幅度在论文中没有给出明确的量化数据。

🎯 应用场景

GenDB具有广泛的应用前景,可用于构建自适应的数据库系统,能够根据数据特征、查询模式和硬件环境自动优化查询执行。它还可以应用于数据分析、商业智能等领域,提高查询效率和降低运营成本。未来,GenDB有望成为下一代数据库系统的核心技术。

📄 摘要(原文)

Traditional query processing relies on engines that are carefully optimized and engineered by many experts. However, new techniques and user requirements evolve rapidly, and existing systems often cannot keep pace. At the same time, these systems are difficult to extend due to their internal complexity, and developing new systems requires substantial engineering effort and cost. In this paper, we argue that recent advances in Large Language Models (LLMs) are starting to shape the next generation of query processing systems. We propose using LLMs to synthesize execution code for each incoming query, instead of continuously building, extending, and maintaining complex query processing engines. As a proof of concept, we present GenDB, an LLM-powered agentic system that generates instance-optimized and customized query execution code tailored to specific data, workloads, and hardware resources. We implemented an early prototype of GenDB that uses Claude Code Agent as the underlying component in the multi-agent system, and we evaluate it on OLAP workloads. We use queries from the well-known TPC-H benchmark and also construct a new benchmark designed to reduce potential data leakage from LLM training data. We compare GenDB with state-of-the-art query engines, including DuckDB, Umbra, MonetDB, ClickHouse, and PostgreSQL. GenDB achieves significantly better performance than these systems. Finally, we discuss the current limitations of GenDB and outline future extensions and related research challenges.