好的,这是您要求的英文文章的中文翻译,已按照规范处理格式、术语和结构。
rohitg00 agentmemory
您的编码代理会记住一切。无需重复解释。基于 iii 引擎构建。为 Claude Code、Cursor、Gemini CLI、Codex CLI、pi、OpenCode 以及任何 MCP 客户端提供持久化记忆。该要点通过置信度评分、生命周期、知识图谱和混合搜索,扩展了 Karpathy 的 LLM Wiki 模式。agentmemory 是其具体实现。快速入门 • 基准测试 • 竞品对比 • 代理 • 工作原理 • MCP • 查看器 • iii 控制台 • 由 iii 提供支持 • 配置 • API
agentmemory 可与任何支持 hooks、MCP 或 REST API 的代理协同工作。所有代理共享同一个记忆服务器。
- Claude Code:12 个 hooks + MCP + 技能
- OpenClaw:MCP + 插件
- Hermes:MCP + 插件
- Cursor:MCP 服务器
- Gemini CLI:MCP 服务器
- OpenCode:MCP 服务器
- Codex CLI:MCP 服务器
- Cline:MCP 服务器
- Goose:MCP 服务器
- Kilo Code:MCP 服务器
- Aider:REST API
- Claude Desktop:MCP 服务器
- Windsurf:MCP 服务器
- Roo Code:MCP 服务器
- Claude SDK:AgentSDKProvider
- 任何代理:REST API
适用于任何支持 MCP 或 HTTP 的代理。一个服务器,所有代理共享记忆。
您在每个会话中都要解释相同的架构。您会重新发现相同的错误。您会重新教授相同的偏好。内置记忆(CLAUDE.md、.cursorrules)上限为 200 行,并且会过时。agentmemory 解决了这个问题。它静默地捕获您的代理所做的事情,将其压缩成可搜索的记忆,并在下一个会话开始时注入正确的上下文。一个命令。跨代理工作。
变化之处:
- 会话 1:您设置了 JWT 认证。
- 会话 2:您请求了速率限制。
代理已经知道您的认证使用了 src/middleware/auth.ts 中的 jose 中间件,您的测试涵盖了令牌验证,并且您为了 Edge 兼容性选择了 jose 而非 jsonwebtoken。无需重新解释。无需复制粘贴。代理就是知道。
npx @agentmemory/agentmemory
v0.9.0 新特性 — 落地页位于 agent-memory.dev,新增文件系统连接器(@agentmemory/fs-watcher),独立的 MCP 现在代理到正在运行的服务器,以便 hooks 和查看器保持一致,审计策略在所有删除路径上得到统一编码,健康检查不再对小 Node 进程标记 memory_critical。完整说明请见 CHANGELOG.md。
检索准确率
LongMemEval-S (ICLR 2025, 500 个问题)
| 系统 | R@5 | R@10 | MRR | | :--- | :--- | :--- | :--- | | agentmemory | 95.2% | 98.6% | 88.2% | | 仅 BM25 回退 | 86.2% | 94.6% | 71.5% |
Token 节省
| 方法 | Token/年 | 成本/年 | | :--- | :--- | :--- | | 粘贴完整上下文 | 19.5M+ | 不可能(超出窗口) | | LLM 总结 | ~650K | ~$500 | | agentmemory | ~170K | ~$10 | | agentmemory + 本地嵌入 | ~170K | $0 |
嵌入模型:all-MiniLM-L6-v2(本地,免费,无需 API 密钥)。完整报告:benchmark/LONGMEMEVAL.md、benchmark/QUALITY.md、benchmark/SCALE.md。竞品对比:benchmark/COMPARISON.md — agentmemory vs mem0、Letta、Khoj、claude-mem、Hippo。
| 特性 | agentmemory | mem0 (53K ⭐) | Letta / MemGPT (22K ⭐) | 内置 (CLAUDE.md) | | :--- | :--- | :--- | :--- | :--- | | 类型 | 记忆引擎 + MCP 服务器 | 记忆层 API | 完整代理运行时 | 静态文件 | | 检索 R@5 | 95.2% | 68.5% (LoCoMo) | 83.2% (LoCoMo) | N/A (grep) | | 自动捕获 | 12 个 hooks(零手动操作) | 手动 add() 调用 | 代理自我编辑 | 手动编辑 | | 搜索 | BM25 + 向量 + 图 (RRF 融合) | 向量 + 图 | 向量(归档) | 将所有内容加载到上下文中 | | 多代理 | MCP + REST + 租约 + 信号 | API(无协调) | 仅在 Letta 运行时内 | 按代理文件 | | 框架锁定 | 无(任何 MCP 客户端) | 无 | 高(必须使用 Letta) | 按代理格式 | | 外部依赖 | 无(SQLite + iii-engine) | Qdrant / pgvector | Postgres + 向量数据库 | 无 | | 记忆生命周期 | 4 层整合 + 衰减 + 自动遗忘 | 被动提取 | 代理管理 | 手动修剪 | | Token 效率 | ~1,900 tokens/会话 ($10/年) | 因集成而异 | 核心记忆在上下文中 | 22K+ tokens 在 240 条观测时 | | 实时查看器 | 是 (端口 3113) | 云仪表盘 | 云仪表盘 | 否 | | 自托管 | 是(默认) | 可选 | 可选 | 是 |
兼容性: 此版本目标为稳定的 iii-sdk ^0.11.0 和 iii-engine v0.11.x。
30 秒内尝试
# 终端 1:启动服务器
npx @agentmemory/agentmemory
# 终端 2:植入示例数据并查看召回效果
npx @agentmemory/agentmemory demo
demo 会植入 3 个逼真的会话(JWT 认证、N+1 查询修复、速率限制),并针对它们运行语义搜索。您会看到当搜索“数据库性能优化”时,它能找到“N+1 查询修复”——关键词匹配无法做到这一点。
打开 http://localhost:3113 实时观看记忆构建过程。
会话回放
agentmemory 记录的每个会话都是可回放的。打开查看器,选择“回放”选项卡,在时间线上拖动:提示、工具调用、工具结果和响应会作为离散事件呈现,支持播放/暂停、速度控制(0.5 倍 – 4 倍)和键盘快捷键(空格键切换,方向键步进)。
已经有旧的 Claude Code JSONL 转录文件想要导入?
# 导入 ~/.claude/projects 下的所有内容
npx @agentmemory/agentmemory import-jsonl
# 或者导入单个文件
npx @agentmemory/agentmemory import-jsonl ~/.claude/projects/-my-project/abc123.jsonl
导入的会话会与原生会话一起显示在回放选择器中。在底层,每个条目都通过 mem::replay::load、mem::replay::sessions 和 mem::replay::import-jsonl 这些 iii 函数进行路由——没有旁路服务器。
升级 / 维护
当您有意更新本地运行时,请使用维护命令:
npx @agentmemory/agentmemory upgrade
警告: 此命令会修改当前工作空间/运行时。它可能更新 JavaScript 依赖项,可能运行 cargo install iii-engine --force,并且可能拉取 Docker 镜像。实现细节位于 src/cli.ts(参见 src/cli.ts:544-595 区域附近的 runUpgrade 函数)。
Claude Code(一个代码块,粘贴即可)
安装 agentmemory:在单独的终端中运行 npx @agentmemory/agentmemory 以启动记忆服务器。然后运行 /plugin marketplace add rohitg00/agentmemory 和 /plugin install agentmemory — 该插件会注册所有 12 个 hooks、4 个技能,并通过其 .mcp.json 自动连接 @agentmemory/mcp stdio 服务器,因此您无需任何额外配置步骤即可获得 51 个 MCP 工具(memory_smart_search、memory_save、memory_sessions、memory_governance_delete 等)。使用 curl http://localhost:3111/agentmemor 进行验证。