Constraint-Aware Corrective Memory for Language-Based Drug Discovery Agents

作者: Maochen Sun, Youzhi Zhang, Gaofeng Meng

分类: cs.AI

发布日期: 2026-04-10

💡 一句话要点

提出CACM框架，通过约束感知的修正记忆提升语言驱动的药物发现Agent性能。

🎯 匹配领域: 支柱九：具身大模型 (Embodied Foundation Models)

关键词: 药物发现 语言模型 约束优化 修正记忆 序列生成

📋 核心要点

现有语言驱动的药物发现Agent依赖长历史和欠明确反思，导致失败定位难和Agent状态噪声大。
CACM框架通过协议审计和诊断器定位违规，生成修正提示，并利用分通道压缩记忆保持规划上下文紧凑。
实验表明，CACM在目标级成功率上比现有方法提升36.4%，验证了精确诊断和经济Agent状态的重要性。

📝 摘要（中文）

大型语言模型使得自主药物发现Agent成为可能，但其成功并非取决于单一行动或分子，而是最终返回的候选集是否满足协议级要求，如集合大小、多样性、结合质量和可开发性。这带来一个控制问题：Agent逐步规划，而任务有效性在候选集层面决定。现有系统依赖冗长的历史和欠明确的自我反思，导致失败定位不精确和Agent状态噪声增加。我们提出了约束感知修正记忆（CACM），一个基于精确集合级诊断和简洁记忆回写机制的语言驱动药物发现框架。CACM引入协议审计和基于事实的诊断器，分析跨任务要求、口袋环境和候选集证据的多模态信息，定位协议违规，生成可操作的修正提示，并引导后续行动进行相关修正。为保持规划上下文紧凑，CACM将记忆组织为静态、动态和修正通道，并在回写前压缩，从而保留持久任务信息，同时仅暴露决策相关的失败。实验结果表明，CACM比最先进的基线方法提高了36.4%的目标级成功率。结果表明，可靠的语言驱动药物发现不仅受益于更强大的分子工具，还受益于更精确的诊断和更经济的Agent状态。

🔬 方法详解

问题定义：论文旨在解决语言驱动的药物发现Agent在满足协议级约束（如集合大小、多样性、结合质量等）方面的不足。现有方法依赖于冗长的历史信息和不明确的自我反思，导致失败定位不准确，Agent状态噪声过大，难以有效指导后续的分子生成过程。

核心思路：论文的核心思路是引入约束感知的修正记忆（Constraint-Aware Corrective Memory, CACM）。通过精确的集合层面诊断，定位违反协议要求的具体问题，并生成可操作的修正提示，从而引导Agent进行更有效的分子设计。同时，通过压缩记忆，保持规划上下文的紧凑性，降低Agent状态的噪声。

技术框架：CACM框架包含以下主要模块：1) 协议审计（Protocol Auditing）：用于检查当前候选分子集合是否满足预定义的协议要求。2) 基于事实的诊断器（Grounded Diagnostician）：分析多模态证据（任务要求、口袋环境、候选集信息），定位协议违规，并生成修正提示。3) 分通道记忆（Channel-wise Memory）：将记忆组织为静态、动态和修正通道，分别存储长期任务信息、短期状态信息和修正信息。4) 记忆压缩（Memory Compression）：在回写记忆之前，对记忆进行压缩，保留关键信息，降低噪声。

关键创新：CACM的关键创新在于：1) 精确的集合层面诊断：不同于以往依赖长历史的模糊诊断，CACM能够精确定位违反协议要求的具体问题。2) 约束感知的修正提示：生成的修正提示能够直接指导Agent进行分子设计，提高效率。3) 分通道压缩记忆：有效管理和压缩Agent的记忆，降低状态噪声，提高规划效率。

关键设计：论文中关于参数设置、损失函数、网络结构等技术细节描述较少，具体实现细节未知。但分通道记忆的设计是关键，它允许Agent区分不同类型的信息，并有选择地更新和压缩记忆。记忆压缩的具体算法未知，但其目标是保留关键信息，降低噪声。

🖼️ 关键图片

📊 实验亮点

实验结果表明，CACM框架在目标级成功率上比最先进的基线方法提高了36.4%。这一显著的提升表明，精确的集合层面诊断和经济的Agent状态对于可靠的语言驱动药物发现至关重要。具体的基线方法和数据集信息未知，但36.4%的提升幅度足以证明CACM的有效性。

🎯 应用场景

该研究成果可应用于自动化药物发现流程，加速新药研发进程。通过更精确的诊断和更经济的Agent状态，可以提高药物发现的成功率，降低研发成本，并有望发现更具潜力的候选药物。该方法还可扩展到其他需要满足复杂约束的序列生成任务中。

📄 摘要（原文）

Large language models are making autonomous drug discovery agents increasingly feasible, but reliable success in this setting is not determined by any single action or molecule. It is determined by whether the final returned set jointly satisfies protocol-level requirements such as set size, diversity, binding quality, and developability. This creates a fundamental control problem: the agent plans step by step, while task validity is decided at the level of the whole candidate set. Existing language-based drug discovery systems therefore tend to rely on long raw history and under-specified self-reflection, making failure localization imprecise and planner-facing agent states increasingly noisy. We present CACM (Constraint-Aware Corrective Memory), a language-based drug discovery framework built around precise set-level diagnosis and a concise memory write-back mechanism. CACM introduces protocol auditing and a grounded diagnostician, which jointly analyze multimodal evidence spanning task requirements, pocket context, and candidate-set evidence to localize protocol violations, generate actionable remediation hints, and bias the next action toward the most relevant correction. To keep planning context compact, CACM organizes memory into static, dynamic, and corrective channels and compresses them before write-back, thereby preserving persistent task information while exposing only the most decision-relevant failures. Our experimental results show that CACM improves the target-level success rate by 36.4% over the state-of-the-art baseline. The results show that reliable language-based drug discovery benefits not only from more powerful molecular tools, but also from more precise diagnosis and more economical agent states.

Constraint-Aware Corrective Memory for Language-Based Drug Discovery Agents

💡 一句话要点

📋 核心要点

📝 摘要（中文）

🔬 方法详解

🖼️ 关键图片

📊 实验亮点

🎯 应用场景

📄 摘要（原文）

⭐ 我的收藏

📁 新建收藏夹

⚙️ 管理收藏夹

🔍 搜索论文

🔐 登录 / 注册

👤 用户管理