摘要: 智能体记忆通常要么通过离线方式从精心策划的演示中构建,要么通过在线方式从部署后的交互中构建。然而,无论记忆如何构建,当智能体首次被引入一个没有任何特定任务经验的新环境时,都会面临冷启动缺口。在本文中,我们研究了任务前记忆构建:智能体能否在观察到任何目标环境任务之前,仅使用自我生成的合成练习来构建程序性记忆。然而,仅靠合成交互是不够的,因为如果不控制练习内容和存储内容,合成任务会变得冗余、不可行,并最终失去信息价值,而且由于未经过滤的轨迹,记忆会迅速退化。为了克服这一点,我们提出了 Preping,一个由提议者引导的记忆构建框架。其核心是提议者记忆,这是一种结构化的控制状态,用于塑造未来的练习。一个提议者(Proposer)根据这种状态生成合成任务,一个求解器(Solver)执行这些任务,而一个验证器(Validator)则决定哪些轨迹有资格插入记忆,同时提供反馈以指导未来的提议。在 AppWorld、BFCL v3 和 MCP-Universe 上的实验表明,Preping 相比无记忆基线有显著提升,并且其性能可与基于离线或在线经验构建的强大剧本方法相媲美,同时在 AppWorld 上的部署成本比在线记忆构建低 $2.99$ 倍,在 BFCL v3 上低 $2.23$ 倍。进一步的分析表明,其主要优势并非仅仅来自合成数据量,而是来自提议者侧对可行性、冗余性和覆盖率的控制,并结合了选择性记忆更新。