40. 【实战】微调会使用计算工具的 Agent 模型#
40.1. 任务背景#
大模型本身只有”大脑”(推理和生成能力),没有”手脚”(连接外部世界的能力),工具调用就是给它装上手脚的协议。大模型 Agent 的工具调用(Tool Calling / Function Calling)的根本动机:弥补大模型的先天局限。
纯大模型存在三个硬边界:
知识截止:训练数据有截止日期,无法获取实时信息(如今日股价、天气)。
无法行动:只能生成文本,不能直接操作外部系统(如发邮件、查数据库、订机票)。
计算/幻觉:不擅长精确数学计算,且可能一本正经地胡说八道。
工具调用正是为了突破这些边界,让模型在需要时能跳出文本生成,去使用外部工具。没有工具调用时,大模型只是一个对话系统;有了工具调用能力,它才进化为 Agent(智能体):
感知:通过工具读取外部状态。
推理:自主规划该用哪些工具、按什么顺序用。
行动:通过工具影响外部世界。
40.2. 任务内容#
本次任务将在 Qwen2.5-0.5B-Instruct 基座模型上,通过 LoRA 微调,训练一个会使用计算工具的 Agent 模型,让大模型具备精确计算的能力。

本次任务使的模型、微调方式和微调框架如下:
基础模型:Qwen2.5-0.5B-Instruct
微调方式:LoRA
微调框架:Swift
40.3. 学习收获#
完成本次任务,你将会:
理解使大模型具备工具调用能力的必要性
掌握 Agent 模型调用工具的典型流程
掌握构造 Agent 工具调用能力训练数据的方法
了解工具定义、注册、解析与执行的完整过程
掌握在大模型推理过程中使用工具的方式
能够训练具备工具调用能力的 Agent 模型
40.4. 获取源码#
点击下方链接,获取任务完整源码 👇👇👇
○ 如果你觉得这篇文章有所帮助,欢迎将本文链接推荐给更多人——无论是分享到朋友圈、博客、社群,还是任何你常逛的地方。每一次转发,都会让它在搜索结果中更容易被有需要的人看到。