SkillSmith: Compiling Agent Skills into Boundary-Guided Runtime Interfaces

摘要： 近年来，技能（skills）在基于大语言模型（LLM）的智能体系统中被广泛采用，覆盖了多个领域。在现有框架中，技能一旦与运行时任务匹配，通常会被注入到智能体的推理循环中作为上下文指导，从而提供专门的求解能力。我们发现，这种执行范式引入了两大冗余来源：无关上下文注入以及重复的技能特定推理与规划。为此，我们提出 SkillSmith，一种边界优先的编译器-运行时框架，它将技能包离线编译为最小可执行接口。通过从技能中提取细粒度的操作边界，SkillSmith 使智能体能够在运行时动态访问并仅执行相关组件，从而最大程度减少不必要的上下文注入和冗余推理开销。在 SkillsBench 基准上的评估显示，与使用原始技能相比，SkillSmith 将求解阶段的 token 使用量减少了 57.44%，思考迭代次数减少了 42.99%，求解时间减少了 50.57%（速度提升 2.02 倍），以及按 token 比例计算的货币成本减少了 57.44%。此外，由更强模型生成的编译产物可以被更小或更高效的运行时模型复用，从而在原始技能解释失败的情况下提升任务准确率。源代码和数据可在以下链接获取：this https URL。