Agentic Multi-Source Grounding for Enhanced Query Intent Understanding: A DoorDash Case Study

📄 arXiv: 2603.01486v1 📥 PDF

作者: Emmanuel Aboah Boateng, Kyle MacDonald, Akshad Viswanathan, Sudeep Das

分类: cs.AI

发布日期: 2026-03-02

备注: 5 pages, 4 figures


💡 一句话要点

提出Agentic多源 grounding 系统,增强电商平台搜索中query意图理解

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 多源Grounding 意图理解 大型语言模型 电商搜索 Agentic搜索

📋 核心要点

  1. 现有方法在处理电商平台中意图模糊的搜索query时,存在分类器“赢者通吃”和LLM产生幻觉的问题。
  2. 论文提出Agentic多源grounding系统,通过目录检索和agentic网络搜索,对LLM推理进行grounding,解决意图模糊问题。
  3. 实验表明,该系统在DoorDash搜索平台上显著提升了query意图理解的准确率,尤其是在长尾query上。

📝 摘要(中文)

本文提出了一种Agentic多源grounding系统,旨在解决多品类市场中用户查询意图模糊的问题。该系统通过(i)分阶段的目录实体检索流程和(ii)自主调用的agentic网络搜索工具,对LLM推理进行grounding,从而克服了传统分类器的“赢者通吃”分配方式和通用LLM产生幻觉的问题。模型输出一个有序的多意图集合,并通过可配置的消歧层进行解析,该消歧层应用确定性的业务策略,并可扩展到个性化信号。这种解耦设计具有通用性,允许任何市场提供自己的grounding源和解析规则,而无需修改核心架构。在DoorDash的多垂直搜索平台上评估,该系统比未grounding的LLM基线提高了+10.9pp,比传统的生产系统提高了+4.6pp。在长尾查询上,目录grounding贡献了+8.3pp,agentic网络搜索grounding贡献了+3.2pp,双重意图消歧贡献了+1.5pp,准确率达到90.7%(比基线提高+13.0pp)。该系统已部署在生产环境中,服务于超过95%的每日搜索展示。

🔬 方法详解

问题定义:论文旨在解决多品类电商平台中,用户查询意图模糊的问题,例如“Wildflower”可能指餐厅、商品或花店。传统分类器强制选择一个类别,而通用LLM可能给出不存在的商品信息,导致用户体验下降。

核心思路:核心思路是通过多源grounding来增强LLM对用户query的理解。具体来说,利用平台自身的商品目录和实时的网络搜索结果,为LLM提供更丰富的上下文信息,从而避免幻觉并提高意图识别的准确性。这种方法的核心在于将LLM的推理过程与外部知识库相结合。

技术框架:整体架构包含以下几个主要模块:1) 查询接收模块:接收用户的搜索query。2) 多源Grounding模块:包含分阶段的目录实体检索pipeline和agentic网络搜索工具,用于检索相关的商品信息和网络信息。3) LLM推理模块:利用grounding后的信息,生成一个有序的多意图集合。4) 消歧模块:根据业务策略和个性化信号,对多意图集合进行解析,确定最终的搜索结果。

关键创新:最重要的创新在于Agentic多源grounding。传统方法依赖于单一的分类器或LLM,而本文提出的方法将LLM与平台自身的知识库和实时网络信息相结合,从而更好地理解用户意图。此外,解耦的设计使得系统具有更好的通用性和可扩展性。

关键设计:关键设计包括:1) 分阶段的目录实体检索pipeline:通过多阶段的检索,提高检索效率和准确性。2) Agentic网络搜索工具:自主调用网络搜索,获取最新的信息。3) 可配置的消歧层:根据业务策略和个性化信号,灵活地进行意图消歧。具体的参数设置、损失函数和网络结构等细节在论文中未详细描述,属于未知信息。

🖼️ 关键图片

fig_0
fig_1

📊 实验亮点

实验结果表明,该系统在DoorDash的多垂直搜索平台上,比未grounding的LLM基线提高了+10.9pp,比传统的生产系统提高了+4.6pp。在长尾查询上,准确率达到90.7%,比基线提高+13.0pp。这些结果表明,该系统能够显著提升query意图理解的准确率,尤其是在意图模糊的长尾query上。

🎯 应用场景

该研究成果可广泛应用于多品类电商平台的搜索系统,提升用户搜索体验,提高转化率。此外,该方法还可以应用于其他需要利用外部知识库进行决策的场景,例如智能客服、知识图谱问答等。通过结合LLM和外部知识,可以构建更加智能和可靠的AI系统。

📄 摘要(原文)

Accurately mapping user queries to business categories is a fundamental Information Retrieval challenge for multi-category marketplaces, where context-sparse queries such as "Wildflower" exhibit intent ambiguity, simultaneously denoting a restaurant chain, a retail product, and a floral item. Traditional classifiers force a winner-takes-all assignment, while general-purpose LLMs hallucinate unavailable inventory. We introduce an Agentic Multi-Source Grounded system that addresses both failure modes by grounding LLM inference in (i) a staged catalog entity retrieval pipeline and (ii) an agentic web-search tool invoked autonomously for cold-start queries. Rather than predicting a single label, the model emits an ordered multi-intent set, resolved by a configurable disambiguation layer that applies deterministic business policies and is designed for extensibility to personalization signals. This decoupled design generalizes across domains, allowing any marketplace to supply its own grounding sources and resolution rules without modifying the core architecture. Evaluated on DoorDash's multi-vertical search platform, the system achieves +10.9pp over the ungrounded LLM baseline and +4.6pp over the legacy production system. On long-tail queries, incremental ablations attribute +8.3pp to catalog grounding, +3.2pp to agentic web search grounding, and +1.5pp to dual intent disambiguation, yielding 90.7% accuracy (+13.0pp over baseline). The system is deployed in production, serving over 95% of daily search impressions, and establishes a generalizable paradigm for applications requiring foundation models grounded in proprietary context and real-time web knowledge to resolve ambiguous, context-sparse decision problems at scale.