以下是您要求的英文文章的中文翻译,已按照要求保留原文结构、技术术语和代码块,并输出为 Markdown 格式。
LearningCircuit local-deep-research
Local Deep Research
AI 驱动的深度、自主化研究助手。 使用多个 LLM 和搜索引擎进行深度、自主化研究,并附带正确的引用。 ▶️ 观看 *The Art Of The Terminal* 的评测视频
🚀 什么是 Local Deep Research?
由你掌控的 AI 研究助手。 本地运行以保护隐私,可使用任何 LLM,并构建你可搜索的知识库。 你拥有自己的数据,并清楚了解其运作方式。
⚡ 快速开始
选项 1:Docker 运行(Linux)
# 步骤 1:拉取并运行 Ollama
docker run -d -p 11434:11434 --name ollama ollama/ollama
docker exec ollama ollama pull gpt-oss:20b
# 步骤 2:拉取并运行 SearXNG 以获得最佳搜索结果
docker run -d -p 8080:8080 --name searxng searxng/searxng
# 步骤 3:拉取并运行 Local Deep Research
docker run -d -p 5000:5000 --network host \
--name local-deep-research \
--volume "deep-research:/data" \
-e LDR_DATA_DIR=/data \
localdeepresearch/local-deep-research
选项 2:Docker Compose
仅 CPU(所有平台):
curl -O https://raw.githubusercontent.com/LearningCircuit/local-deep-research/main/docker-compose.yml && docker compose up -d
使用 NVIDIA GPU(Linux):
curl -O https://raw.githubusercontent.com/LearningCircuit/local-deep-research/main/docker-compose.yml && \
curl -O https://raw.githubusercontent.com/LearningCircuit/local-deep-research/main/docker-compose.gpu.override.yml && \
docker compose -f docker-compose.yml -f docker-compose.gpu.override.yml up -d
等待约 30 秒后,打开 http://localhost:5000。 关于 GPU 设置、环境变量等更多信息,请参阅 Docker Compose 指南。
选项 3:pip 安装
pip install local-deep-research
适用于 Windows、macOS 和 Linux。 SQLCipher 加密已通过预编译的 wheels 包含在内——无需编译。 Windows 上的 PDF 导出需要 Pango(设置指南)。 如果遇到加密问题,请设置 export LDR_BOOTSTRAP_ALLOW_UNENCRYPTED=true 以改用标准 SQLite。
更多安装选项 →
🏗️ 工作原理
研究
你提出一个复杂问题。 LDR 自动为你进行研究:
- 搜索网络、学术论文以及你自己的文档
- 将所有内容综合成一份带有正确引用的报告
从 20 多种研究策略中选择,适用于快速查询、深度分析或学术研究。
新增:LangGraph Agent 策略 — 一种自主代理研究模式,LLM 自行决定搜索什么、使用哪些专业引擎(arXiv、PubMed、Semantic Scholar 等)以及何时进行综合。早期结果令人鼓舞——它能根据发现的内容自适应地在搜索引擎之间切换,并收集比基于流水线的策略多得多的来源。在“设置”中选择 langgraph-agent 即可尝试。
构建你的知识库
flowchart LR
R[研究] --> D[下载来源]
D --> L[(库)]
L --> I[索引与嵌入]
I --> S[搜索你的文档]
S -.-> R
每次研究会话都会找到有价值的来源。将它们直接下载到你的加密库中——来自 ArXiv 的学术论文、PubMed 的文章、网页等。LDR 会提取文本、索引所有内容并使其可搜索。下次研究时,你可以同时针对自己的文档和实时网络提问。你的知识会随时间不断积累。
🛡️ 安全性
flowchart LR
U1[用户 A] --> D1[(加密数据库)]
U2[用户 B] --> D2[(加密数据库)]
你的数据始终属于你。每个用户拥有自己独立的 SQLCipher 数据库,使用 AES-256 加密(Signal 级别安全)。无密码恢复机制意味着真正的零知识——即使是服务器管理员也无法读取你的数据。与 Ollama + SearXNG 完全本地运行,数据永远不会离开你的机器。
内存中的凭据:与所有在运行时使用密钥的应用程序(包括密码管理器、浏览器和 API 客户端)一样,凭据在活动会话期间会以明文形式保存在进程内存中。这是业界普遍接受的现实,并非 LDR 特有:如果攻击者能够读取进程内存,他们也能读取任何进程内的解密密钥。我们通过会话范围的凭据生命周期和核心转储排除来缓解此问题。欢迎通过 GitHub Issues 提出进一步改进的想法。详情请参阅我们的安全策略。
供应链安全:Docker 镜像使用 Cosign 签名,包含 SLSA 来源证明,并附带 SBOM。验证方式:
cosign verify localdeepresearch/local-deep-research:latest
安全透明度:扫描抑制项已在以下文档中附有理由说明:安全警报评估、Scorecard 合规性、容器 CVE 抑制项以及 SAST 规则依据。某些警报(Dependabot、代码扫描)只能在 GitHub 安全选项卡中关闭或极难在外部抑制,因此上述文件并未涵盖所有已关闭的发现项。
详细架构 → | 安全策略 → | 安全审查流程 →
🔒 隐私与数据
Local Deep Research 不包含任何遥测、分析或跟踪功能。 我们不会收集、传输或存储任何关于你或你使用情况的数据。 没有分析 SDK、没有回拨电话、没有崩溃报告、没有外部脚本。 使用指标仅保留在你本地的加密数据库中。
LDR 发出的唯一网络调用是你主动发起的:搜索查询(发送给你配置的引擎)、LLM API 调用(发送给你选择的提供商)以及通知(仅在你设置了 Apprise 的情况下)。
由于我们不收集任何使用数据,我们依赖你来告诉我们哪些功能好用、哪些出了问题、以及你希望接下来看到什么——错误报告、功能想法,甚至是你喜欢或从不使用的功能,都有助于我们改进 LDR。
📊 性能
- SimpleQA 基准测试中约 95% 的准确率(初步结果)
- 使用 GPT-4.1-mini + SearXNG + focused-iteration 策略进行测试
- 与最先进的 AI 研究系统相当
- 本地模型通过适当配置也能达到类似性能
🧭 在选择模型?请使用社区基准测试
不确定在 LDR 中运行哪个本地模型? 社区维护的 LDR 基准测试数据集(Hugging Face)追踪了不同模型、搜索引擎和研究策略下的准确率——这是查看哪些 Ollama / LM Studio / llama.cpp 模型表现最佳的最快方式。
如果您需要调整任何术语或风格,请随时告知。