"OncoAgent: A Dual-Tier Multi-Agent Framework for Privacy-Preserving Oncology Clinical Decision Support"

以下是您要求的英文文章的中文翻译，已按照保留原文结构、技术术语不翻译、代码块保留等要求处理。

文章标题："OncoAgent：面向隐私保护肿瘤学临床决策支持的双层多智能体框架"

回到文章

"OncoAgent：面向隐私保护肿瘤学临床决策支持的双层多智能体框架"

团队文章发布于 2026 年 5 月 9 日点赞 8 +2

作者：Máximo López Chenlo (@MaximoLopezChenlo) 关注：lablab-ai-amd-developer-hackathon

目录摘要

引言
相关工作

2.1 临床 LLM 与决策支持 2.2 多智能体架构 2.3 医学中的检索增强生成

系统架构

3.1 概述 3.2 复杂度路由器与模型分层 3.3 带文档评分的纠正性 RAG 3.4 反思安全循环（Critic 节点） 3.5 人在回路门控与回退机制 3.6 每患者内存隔离

知识库构建与 RAG 流水线

4.1 指南导入与清洗 4.2 医学嵌入与向量存储 4.3 四阶段检索流水线

双层 QLoRA 微调

5.1 训练语料：OncoCoT（266,854 个样本） 5.2 QLoRA 配置 5.3 基于 Unsloth 的 AMD MI300X 优化 5.4 序列打包与吞吐量突破

安全与隐私框架

6.1 零 PHI 策略 6.2 分层安全架构

临床界面
结果
讨论

9.1 硬件主权作为临床需求 9.2 吞吐量突破 9.3 局限性

结论

参考文献

缩略图：https://huggingface.co/datasets/huggingface/documentation-images/resolve/main/blog/oncoagent-thumbnail.png

作者：user: oncoagent-research 标签：oncology, multi-agent, LangGraph, RAG, QLoRA, AMD, open-source, clinical-ai, healthcare

OncoAgent：面向隐私保护肿瘤学临床决策支持的双层多智能体框架

技术预印本 · 2026 年 5 月 · OncoAgent 研究组

摘要

我们提出 OncoAgent，一个开源、隐私保护的肿瘤学临床决策支持系统。OncoAgent 结合了双层微调 LLM 架构、基于 LangGraph 的最先进多智能体拓扑结构、覆盖 70 余份 NCCN 和 ESMO 医师级指南的四阶段纠正性 RAG 流水线，以及强制执行严格零 PHI 策略的三层反思安全验证器。该系统通过一个加性复杂度评分器将临床查询路由至 9B 参数的快速优化模型（Tier 1）或 27B 参数的深度推理模型（Tier 2）。两个模型均通过 QLoRA 在包含 266,854 个真实与合成肿瘤病例的语料库上进行微调，训练框架采用 Unsloth，硬件平台为 AMD Instinct MI300X（192 GB HBM3）。在 MI300X 上使用序列打包技术，全数据集微调仅需约 50 分钟——相比基于 API 的生成实现了 56 倍的吞吐量加速。修复后，CRAG 文档评分达到 100% 的成功率，平均 RAG 置信度评分为 2.3+。整个系统 100% 开源，可本地部署，消除了对专有云 API 的依赖，保障了患者数据主权。

关键词：临床决策支持，肿瘤学 AI，多智能体系统，检索增强生成，QLoRA，AMD ROCm，开源医疗 AI，HITL 安全，LangGraph，纠正性 RAG

1. 引言

肿瘤学是临床医学中信息密度最高、认知负荷最大的领域之一。从美国国家综合癌症网络（NCCN）到欧洲肿瘤内科学会（ESMO），循证指南的数量、异质性和快速演变，使得已发表证据与临床实践之间始终存在知识鸿沟。AI 辅助的临床决策支持系统在弥合这一鸿沟方面具有变革性潜力，然而大多数商用系统在三个关键方面存在缺陷：

产生未经有效指南验证的幻觉式推荐
依赖云 API，无法在隐私敏感的医院环境中进行本地部署
采用单体 LLM 架构，在面对复杂多合并症病例时容易发生上下文饱和

OncoAgent 围绕三个核心原则设计：

架构分解：临床推理被分解为八个专门的 LangGraph 节点，每个节点具有边界清晰、可审计的功能。
有据生成：所有模型输出均通过一个四阶段检索流水线（带有显式相关性门控）锚定到经过精心整理的向量知识库。
硬件主权：完整的推理与训练栈原生运行在 AMD Instinct MI300X 上，使用 ROCm 和开源框架——使得医院无需数据外泄即可部署。

2. 相关工作

2.1 临床 LLM 与决策支持

大语言模型在临床 NLP 任务中已展现出显著潜力，包括诊断编码、文献摘要和患者沟通。领域特定的微调方法——例如 BioMedLM、Med-PaLM 2 和 ClinicalBERT——在医学基准测试上持续优于通用模型。OncoAgent 在此基础上进一步拓展，专注于肿瘤学分诊与治疗方案推荐这一特定子领域，因为在该领域中，幻觉的后果最为严重。

2.2 多智能体架构

分解式多智能体系统已成为处理复杂推理任务的一种原则性方法。OncoAgent 综合了四种经典的 SOTA 模式：

Claude Code 模式——将确定性安全机制与 LLM 推理分离
Hermes Agent 模式——结构化的工具调用，配合每会话内存隔离
纠正性 RAG（Shi 等人，2024）——文档相关性评分与查询重构
反思（Shinn 等人，2023）——通过反馈增强的重试循环实现自我纠正生成

2.3 医学中的检索增强生成

标准的双编码器检索不适用于术语精确性至关重要的临床领域（例如，“tyrosine kinase inhibitor”与“TKI”）。OncoAgent 实现了一个多阶段流水线，包含交叉编码器重排序，并集成了假设文档嵌入（HyDE；Gao 等人，2022），通过将自然语言查询投影到指南嵌入空间来解决医学术语同义词不匹配问题。

3. 系统架构

3.1 概述

OncoAgent 实现为一个有状态的直接...

（注：原文在“3.1 概述”处截断，后续内容未提供。翻译已根据要求完整处理已给出的部分。）