Claude 工具调用重大升级:Agentic Tool Use
Claude 工具调用重大升级:Agentic Tool Use
整理时间: 2026-02-18 23:19
来源: 群聊消息
整理人: AI助手
摘要
Claude 工具调用迎来重大升级,从传统的一问一答模式转变为代码批量处理模式。Claude 可以预先把成百上千种决策路径写进代码里,一次性执行完成,大幅提升效率和准确率。以网页搜索为例,Sonnet 4.6 在 BrowseComp 基准测试上准确率提升 13%,同时输入 token 减少 32%。
一、升级核心变化
1.1 以前的流程(问答模式)
用户提问 → Claude 调用工具 → 拿到结果 → Claude 决定下一步 → 再调用工具 → 循环往复
- 每次调用工具后都要”回来想一想”
- 多轮 LLM 调用,效率较低
- 决策分散在每一轮交互中
1.2 现在的流程(代码模式)
用户提问 → Claude 先写一段代码 → 这段代码自动调用工具、解析结果、根据条件判断下一步操作 → 最终把处理好的结果交给 Claude
- Claude 提前用代码把各种可能的情况都规划好
- 一次性执行完毕
- 不再每次调用工具后都要”回来想一想”
二、核心优势
2.1 效率提升
| 指标 | 变化 |
|---|---|
| 输入 Token | 减少 32% |
| 决策路径 | 从多轮压缩为一次代码执行 |
| 执行方式 | 成百上千种决策路径预写在代码里 |
2.2 准确率提升
以网页搜索为例(Sonnet 4.6 + BrowseComp 基准):
| 指标 | 提升 |
|---|---|
| 准确率 | +13% |
三、技术原理
3.1 从”每次请示”到”预先规划”
| 模式 | 说明 |
|---|---|
| 旧模式 | AI Agent 每一步都要请示大模型做决定 |
| 新模式 | Claude 预先把决策路径写进代码,一次性跑完 |
3.2 压缩多轮调用
- 原来:多轮 LLM 调用的循环
- 现在:一次代码执行
3.3 程序化工具调用
Claude 可以:
- 自动调用工具
- 解析工具返回的结果
- 根据条件判断下一步操作
- 最终把处理好的结果交给 Claude
四、新增功能
| 功能 | 说明 |
|---|---|
| 代码执行 | 程序化执行复杂任务 |
| 网页抓取 | 更高效的网页内容提取 |
| 记忆 | 跨会话的记忆能力 |
| 搜索 | 升级后的网页搜索 |
五、模型知识更新
5.1 Claude Sonnet 4.6 知识截止
| 知识类型 | 截止时间 |
|---|---|
| 训练知识 | 2026 年 1 月 |
| 可靠知识 | 2025 年 8 月 |
5.2 实时程度
2026年2月发布的模型,已经有1月的知识了,基本上到了 T+30 的实时程度。
六、实际效果
6.1 搜索场景
| 指标 | 效果 |
|---|---|
| 准确率 | 提升 13% |
| 输入 Token | 减少 32% |
| 速度 | 更快 |
6.2 潜力
- 效率提升的潜力非常大
- 适用于各种复杂任务场景
七、总结
7.1 核心变化
- 从问答到代码:Claude 工具调用从一问一答变成写代码批量处理
- 从多轮到一次:多轮 LLM 调用压缩成一次代码执行
7.2 效果
- 准确率提升:+13%
- Token 减少:-32%
- 更快更准
7.3 意义
这标志着 Claude Agent 能力的重大升级,AI 不再是”每次请示”的执行者,而是能够”预先规划”的自主 Agent。
整理备注
本文档基于群聊分享的 Claude 工具调用升级信息整理,包含核心变化、技术原理、效果对比及模型知识更新说明。