PREPING: Building Agent Memory without Tasks

摘要： 智能体记忆通常要么通过离线方式从精心策划的演示中构建，要么通过在线方式从部署后的交互中构建。然而，无论记忆如何构建，当智能体首次被引入一个没有任何特定任务经验的新环境时，都会面临冷启动缺口。在本文中，我们研究了任务前记忆构建：智能体能否在观察到任何目标环境任务之前，仅使用自我生成的合成练习来构建程序性记忆。然而，仅靠合成交互是不够的，因为如果不控制练习内容和存储内容，合成任务会变得冗余、不可行，并最终失去信息价值，而且由于未经过滤的轨迹，记忆会迅速退化。为了克服这一点，我们提出了 Preping，一个由提议者引导的记忆构建框架。其核心是提议者记忆，这是一种结构化的控制状态，用于塑造未来的练习。一个提议者（Proposer）根据这种状态生成合成任务，一个求解器（Solver）执行这些任务，而一个验证器（Validator）则决定哪些轨迹有资格插入记忆，同时提供反馈以指导未来的提议。在 AppWorld、BFCL v3 和 MCP-Universe 上的实验表明，Preping 相比无记忆基线有显著提升，并且其性能可与基于离线或在线经验构建的强大剧本方法相媲美，同时在 AppWorld 上的部署成本比在线记忆构建低 $2.99$ 倍，在 BFCL v3 上低 $2.23$ 倍。进一步的分析表明，其主要优势并非仅仅来自合成数据量，而是来自提议者侧对可行性、冗余性和覆盖率的控制，并结合了选择性记忆更新。