← 返回日报
🌐 机器翻译 · DeepSeek · ArXiv

Agentic Retrieval-Augmented Generation for Financial Document Question Answering


面向金融文档问答的智能体检索增强生成

摘要:金融文档问答(QA)需要对分散在企业申报文件中的异构证据——结构化表格、文本叙述和脚注——进行复杂的多步数值推理。现有的检索增强生成(RAG)方法采用单次检索-生成范式,难以应对金融分析中普遍存在的组合推理链。我们提出FinAgent-RAG,一种智能体RAG框架,它通过自验证机制编排迭代式检索-推理循环,专为金融数值推理的精度要求而设计。该框架整合了三项领域特定创新:(1)对比式金融检索器,通过难负样本挖掘训练,以区分语义相似但数值不同的金融段落;(2)程序化思维推理模块,生成可执行Python代码进行精确算术运算,而非依赖易出错的基于LLM的心算;(3)自适应策略路由器,根据问题复杂度动态分配计算资源,在FinQA上降低41.3%的API成本同时保持准确率。在三个基准数据集——FinQA、ConvFinQA和TAT-QA上的广泛实验表明,FinAgent-RAG分别达到76.81%、78.46%和74.96%的执行准确率,以5.62至9.32个百分点的优势超越最强基线。消融实验、基于四种LLM的跨骨干网络评估以及部署成本分析,均证实了该框架的稳健性及其在金融机构中的实际可行性。

📖 阅读原文 →