智能体技能框架：探讨小型语言模型在工业环境中的潜力

智能体技能框架，现在得到了GitHub Copilot、LangChain和OpenAI等主要玩家的广泛和官方支持，在通过改进上下文工程、减少幻觉和提升任务准确性方面，与专有模型表现尤为出色。基于这些观察，本研究开展了一项调查，以确定智能体技能范式是否为小型语言模型（SLMs）提供类似的好处。这个问题在工业场景中很重要，因为在数据安全和预算限制的要求下，持续依赖公共API是不切实际的，而且在这些场景中，SLMs通常在高度定制化的场景中表现出有限的泛化能力。这项工作首先对智能体技能过程提出了一个正式的数学定义，然后对多个用例中不同大小的语言模型进行了系统的评估。评估涵盖了两个开源任务和一个现实世界的保险索赔数据集。结果显示，小型模型在可靠的技能选择上存在困难，而中等规模的SLMs（参数量约为12B - 30B）从智能体技能方法中获得了实质性收益。此外，大约80B参数的代码专用变体在性能上与封闭源基线相当，同时提高了GPU效率。总体而言，这些发现全面而细致地描述了该框架的能力和限制，并为在以SLM为中心的环境中有效部署智能体技能提供了可操作的见解。