← 返回日报
🌐 机器翻译 · DeepSeek · GitHub

LearningCircuit local-deep-research


以下是您要求的英文文章的中文翻译,已按照要求保留原文结构、技术术语和代码块,并输出为 Markdown 格式。


LearningCircuit local-deep-research

Local Deep Research

AI 驱动的深度、自主化研究助手。 使用多个 LLM 和搜索引擎进行深度、自主化研究,并附带正确的引用。 ▶️ 观看 *The Art Of The Terminal* 的评测视频

🚀 什么是 Local Deep Research?

由你掌控的 AI 研究助手。 本地运行以保护隐私,可使用任何 LLM,并构建你可搜索的知识库。 你拥有自己的数据,并清楚了解其运作方式。

⚡ 快速开始

选项 1:Docker 运行(Linux)

# 步骤 1:拉取并运行 Ollama
docker run -d -p 11434:11434 --name ollama ollama/ollama
docker exec ollama ollama pull gpt-oss:20b

# 步骤 2:拉取并运行 SearXNG 以获得最佳搜索结果
docker run -d -p 8080:8080 --name searxng searxng/searxng

# 步骤 3:拉取并运行 Local Deep Research
docker run -d -p 5000:5000 --network host \
  --name local-deep-research \
  --volume "deep-research:/data" \
  -e LDR_DATA_DIR=/data \
  localdeepresearch/local-deep-research

选项 2:Docker Compose

仅 CPU(所有平台):

curl -O https://raw.githubusercontent.com/LearningCircuit/local-deep-research/main/docker-compose.yml && docker compose up -d

使用 NVIDIA GPU(Linux):

curl -O https://raw.githubusercontent.com/LearningCircuit/local-deep-research/main/docker-compose.yml && \
curl -O https://raw.githubusercontent.com/LearningCircuit/local-deep-research/main/docker-compose.gpu.override.yml && \
docker compose -f docker-compose.yml -f docker-compose.gpu.override.yml up -d

等待约 30 秒后,打开 http://localhost:5000。 关于 GPU 设置、环境变量等更多信息,请参阅 Docker Compose 指南。

选项 3:pip 安装

pip install local-deep-research

适用于 Windows、macOS 和 Linux。 SQLCipher 加密已通过预编译的 wheels 包含在内——无需编译。 Windows 上的 PDF 导出需要 Pango(设置指南)。 如果遇到加密问题,请设置 export LDR_BOOTSTRAP_ALLOW_UNENCRYPTED=true 以改用标准 SQLite。

更多安装选项 →

🏗️ 工作原理

研究

你提出一个复杂问题。 LDR 自动为你进行研究:

从 20 多种研究策略中选择,适用于快速查询、深度分析或学术研究。

新增:LangGraph Agent 策略 — 一种自主代理研究模式,LLM 自行决定搜索什么、使用哪些专业引擎(arXiv、PubMed、Semantic Scholar 等)以及何时进行综合。早期结果令人鼓舞——它能根据发现的内容自适应地在搜索引擎之间切换,并收集比基于流水线的策略多得多的来源。在“设置”中选择 langgraph-agent 即可尝试。

构建你的知识库

flowchart LR
  R[研究] --> D[下载来源]
  D --> L[(库)]
  L --> I[索引与嵌入]
  I --> S[搜索你的文档]
  S -.-> R

每次研究会话都会找到有价值的来源。将它们直接下载到你的加密库中——来自 ArXiv 的学术论文、PubMed 的文章、网页等。LDR 会提取文本、索引所有内容并使其可搜索。下次研究时,你可以同时针对自己的文档和实时网络提问。你的知识会随时间不断积累。

🛡️ 安全性

flowchart LR
  U1[用户 A] --> D1[(加密数据库)]
  U2[用户 B] --> D2[(加密数据库)]

你的数据始终属于你。每个用户拥有自己独立的 SQLCipher 数据库,使用 AES-256 加密(Signal 级别安全)。无密码恢复机制意味着真正的零知识——即使是服务器管理员也无法读取你的数据。与 Ollama + SearXNG 完全本地运行,数据永远不会离开你的机器。

内存中的凭据:与所有在运行时使用密钥的应用程序(包括密码管理器、浏览器和 API 客户端)一样,凭据在活动会话期间会以明文形式保存在进程内存中。这是业界普遍接受的现实,并非 LDR 特有:如果攻击者能够读取进程内存,他们也能读取任何进程内的解密密钥。我们通过会话范围的凭据生命周期和核心转储排除来缓解此问题。欢迎通过 GitHub Issues 提出进一步改进的想法。详情请参阅我们的安全策略。

供应链安全:Docker 镜像使用 Cosign 签名,包含 SLSA 来源证明,并附带 SBOM。验证方式:

cosign verify localdeepresearch/local-deep-research:latest

安全透明度:扫描抑制项已在以下文档中附有理由说明:安全警报评估、Scorecard 合规性、容器 CVE 抑制项以及 SAST 规则依据。某些警报(Dependabot、代码扫描)只能在 GitHub 安全选项卡中关闭或极难在外部抑制,因此上述文件并未涵盖所有已关闭的发现项。

详细架构 → | 安全策略 → | 安全审查流程 →

🔒 隐私与数据

Local Deep Research 不包含任何遥测、分析或跟踪功能。 我们不会收集、传输或存储任何关于你或你使用情况的数据。 没有分析 SDK、没有回拨电话、没有崩溃报告、没有外部脚本。 使用指标仅保留在你本地的加密数据库中。

LDR 发出的唯一网络调用是你主动发起的:搜索查询(发送给你配置的引擎)、LLM API 调用(发送给你选择的提供商)以及通知(仅在你设置了 Apprise 的情况下)。

由于我们不收集任何使用数据,我们依赖你来告诉我们哪些功能好用、哪些出了问题、以及你希望接下来看到什么——错误报告、功能想法,甚至是你喜欢或从不使用的功能,都有助于我们改进 LDR。

📊 性能

不确定在 LDR 中运行哪个本地模型? 社区维护的 LDR 基准测试数据集(Hugging Face)追踪了不同模型、搜索引擎和研究策略下的准确率——这是查看哪些 Ollama / LM Studio / llama.cpp 模型表现最佳的最快方式。


如果您需要调整任何术语或风格,请随时告知。

📖 阅读原文 →