Agentic Retrieval-Augmented Generation for Financial Document Question Answering

面向金融文档问答的智能体检索增强生成

摘要：金融文档问答（QA）需要对分散在企业申报文件中的异构证据——结构化表格、文本叙述和脚注——进行复杂的多步数值推理。现有的检索增强生成（RAG）方法采用单次检索-生成范式，难以应对金融分析中普遍存在的组合推理链。我们提出FinAgent-RAG，一种智能体RAG框架，它通过自验证机制编排迭代式检索-推理循环，专为金融数值推理的精度要求而设计。该框架整合了三项领域特定创新：（1）对比式金融检索器，通过难负样本挖掘训练，以区分语义相似但数值不同的金融段落；（2）程序化思维推理模块，生成可执行Python代码进行精确算术运算，而非依赖易出错的基于LLM的心算；（3）自适应策略路由器，根据问题复杂度动态分配计算资源，在FinQA上降低41.3%的API成本同时保持准确率。在三个基准数据集——FinQA、ConvFinQA和TAT-QA上的广泛实验表明，FinAgent-RAG分别达到76.81%、78.46%和74.96%的执行准确率，以5.62至9.32个百分点的优势超越最强基线。消融实验、基于四种LLM的跨骨干网络评估以及部署成本分析，均证实了该框架的稳健性及其在金融机构中的实际可行性。