摘要: 近年来,技能(skills)在基于大语言模型(LLM)的智能体系统中被广泛采用,覆盖了多个领域。在现有框架中,技能一旦与运行时任务匹配,通常会被注入到智能体的推理循环中作为上下文指导,从而提供专门的求解能力。我们发现,这种执行范式引入了两大冗余来源:无关上下文注入以及重复的技能特定推理与规划。为此,我们提出 SkillSmith,一种边界优先的编译器-运行时框架,它将技能包离线编译为最小可执行接口。通过从技能中提取细粒度的操作边界,SkillSmith 使智能体能够在运行时动态访问并仅执行相关组件,从而最大程度减少不必要的上下文注入和冗余推理开销。在 SkillsBench 基准上的评估显示,与使用原始技能相比,SkillSmith 将求解阶段的 token 使用量减少了 57.44%,思考迭代次数减少了 42.99%,求解时间减少了 50.57%(速度提升 2.02 倍),以及按 token 比例计算的货币成本减少了 57.44%。此外,由更强模型生成的编译产物可以被更小或更高效的运行时模型复用,从而在原始技能解释失败的情况下提升任务准确率。源代码和数据可在以下链接获取:this https URL。