LearningCircuit local-deep-research

以下是您要求的英文文章的中文翻译，已按照要求保留原文结构、技术术语和代码块，并输出为 Markdown 格式。

LearningCircuit local-deep-research

Local Deep Research

AI 驱动的深度、自主化研究助手。使用多个 LLM 和搜索引擎进行深度、自主化研究，并附带正确的引用。 ▶️ 观看 *The Art Of The Terminal* 的评测视频

🚀 什么是 Local Deep Research？

由你掌控的 AI 研究助手。本地运行以保护隐私，可使用任何 LLM，并构建你可搜索的知识库。你拥有自己的数据，并清楚了解其运作方式。

⚡ 快速开始

选项 1：Docker 运行（Linux）

# 步骤 1：拉取并运行 Ollama
docker run -d -p 11434:11434 --name ollama ollama/ollama
docker exec ollama ollama pull gpt-oss:20b

# 步骤 2：拉取并运行 SearXNG 以获得最佳搜索结果
docker run -d -p 8080:8080 --name searxng searxng/searxng

# 步骤 3：拉取并运行 Local Deep Research
docker run -d -p 5000:5000 --network host \
  --name local-deep-research \
  --volume "deep-research:/data" \
  -e LDR_DATA_DIR=/data \
  localdeepresearch/local-deep-research

选项 2：Docker Compose

仅 CPU（所有平台）：

curl -O https://raw.githubusercontent.com/LearningCircuit/local-deep-research/main/docker-compose.yml && docker compose up -d

使用 NVIDIA GPU（Linux）：

curl -O https://raw.githubusercontent.com/LearningCircuit/local-deep-research/main/docker-compose.yml && \
curl -O https://raw.githubusercontent.com/LearningCircuit/local-deep-research/main/docker-compose.gpu.override.yml && \
docker compose -f docker-compose.yml -f docker-compose.gpu.override.yml up -d

等待约 30 秒后，打开 http://localhost:5000。关于 GPU 设置、环境变量等更多信息，请参阅 Docker Compose 指南。

选项 3：pip 安装

pip install local-deep-research

适用于 Windows、macOS 和 Linux。 SQLCipher 加密已通过预编译的 wheels 包含在内——无需编译。 Windows 上的 PDF 导出需要 Pango（设置指南）。如果遇到加密问题，请设置 export LDR_BOOTSTRAP_ALLOW_UNENCRYPTED=true 以改用标准 SQLite。

更多安装选项 →

🏗️ 工作原理

研究

你提出一个复杂问题。 LDR 自动为你进行研究：

搜索网络、学术论文以及你自己的文档
将所有内容综合成一份带有正确引用的报告

从 20 多种研究策略中选择，适用于快速查询、深度分析或学术研究。

新增：LangGraph Agent 策略 — 一种自主代理研究模式，LLM 自行决定搜索什么、使用哪些专业引擎（arXiv、PubMed、Semantic Scholar 等）以及何时进行综合。早期结果令人鼓舞——它能根据发现的内容自适应地在搜索引擎之间切换，并收集比基于流水线的策略多得多的来源。在“设置”中选择 langgraph-agent 即可尝试。

构建你的知识库

flowchart LR
  R[研究] --> D[下载来源]
  D --> L[(库)]
  L --> I[索引与嵌入]
  I --> S[搜索你的文档]
  S -.-> R

每次研究会话都会找到有价值的来源。将它们直接下载到你的加密库中——来自 ArXiv 的学术论文、PubMed 的文章、网页等。LDR 会提取文本、索引所有内容并使其可搜索。下次研究时，你可以同时针对自己的文档和实时网络提问。你的知识会随时间不断积累。

🛡️ 安全性

flowchart LR
  U1[用户 A] --> D1[(加密数据库)]
  U2[用户 B] --> D2[(加密数据库)]

你的数据始终属于你。每个用户拥有自己独立的 SQLCipher 数据库，使用 AES-256 加密（Signal 级别安全）。无密码恢复机制意味着真正的零知识——即使是服务器管理员也无法读取你的数据。与 Ollama + SearXNG 完全本地运行，数据永远不会离开你的机器。

内存中的凭据：与所有在运行时使用密钥的应用程序（包括密码管理器、浏览器和 API 客户端）一样，凭据在活动会话期间会以明文形式保存在进程内存中。这是业界普遍接受的现实，并非 LDR 特有：如果攻击者能够读取进程内存，他们也能读取任何进程内的解密密钥。我们通过会话范围的凭据生命周期和核心转储排除来缓解此问题。欢迎通过 GitHub Issues 提出进一步改进的想法。详情请参阅我们的安全策略。

供应链安全：Docker 镜像使用 Cosign 签名，包含 SLSA 来源证明，并附带 SBOM。验证方式：

cosign verify localdeepresearch/local-deep-research:latest

安全透明度：扫描抑制项已在以下文档中附有理由说明：安全警报评估、Scorecard 合规性、容器 CVE 抑制项以及 SAST 规则依据。某些警报（Dependabot、代码扫描）只能在 GitHub 安全选项卡中关闭或极难在外部抑制，因此上述文件并未涵盖所有已关闭的发现项。

详细架构 → | 安全策略 → | 安全审查流程 →

🔒 隐私与数据

Local Deep Research 不包含任何遥测、分析或跟踪功能。我们不会收集、传输或存储任何关于你或你使用情况的数据。没有分析 SDK、没有回拨电话、没有崩溃报告、没有外部脚本。使用指标仅保留在你本地的加密数据库中。

LDR 发出的唯一网络调用是你主动发起的：搜索查询（发送给你配置的引擎）、LLM API 调用（发送给你选择的提供商）以及通知（仅在你设置了 Apprise 的情况下）。

由于我们不收集任何使用数据，我们依赖你来告诉我们哪些功能好用、哪些出了问题、以及你希望接下来看到什么——错误报告、功能想法，甚至是你喜欢或从不使用的功能，都有助于我们改进 LDR。

📊 性能

SimpleQA 基准测试中约 95% 的准确率（初步结果）
使用 GPT-4.1-mini + SearXNG + focused-iteration 策略进行测试
与最先进的 AI 研究系统相当
本地模型通过适当配置也能达到类似性能

🧭 在选择模型？请使用社区基准测试

不确定在 LDR 中运行哪个本地模型？社区维护的 LDR 基准测试数据集（Hugging Face）追踪了不同模型、搜索引擎和研究策略下的准确率——这是查看哪些 Ollama / LM Studio / llama.cpp 模型表现最佳的最快方式。

如果您需要调整任何术语或风格，请随时告知。