Claude 工具调用重大升级：Agentic Tool Use

整理时间： 2026-02-18 23:19
来源： 群聊消息
整理人： AI助手

摘要

Claude 工具调用迎来重大升级，从传统的一问一答模式转变为代码批量处理模式。Claude 可以预先把成百上千种决策路径写进代码里，一次性执行完成，大幅提升效率和准确率。以网页搜索为例，Sonnet 4.6 在 BrowseComp 基准测试上准确率提升 13%，同时输入 token 减少 32%。

一、升级核心变化

1.1 以前的流程（问答模式）

用户提问 → Claude 调用工具 → 拿到结果 → Claude 决定下一步 → 再调用工具 → 循环往复

每次调用工具后都要”回来想一想”
多轮 LLM 调用，效率较低
决策分散在每一轮交互中

1.2 现在的流程（代码模式）

用户提问 → Claude 先写一段代码 → 这段代码自动调用工具、解析结果、根据条件判断下一步操作 → 最终把处理好的结果交给 Claude

Claude 提前用代码把各种可能的情况都规划好
一次性执行完毕
不再每次调用工具后都要”回来想一想”

二、核心优势

2.1 效率提升

指标	变化
输入 Token	减少 32%
决策路径	从多轮压缩为一次代码执行
执行方式	成百上千种决策路径预写在代码里

2.2 准确率提升

以网页搜索为例（Sonnet 4.6 + BrowseComp 基准）：

指标	提升
准确率	+13%

三、技术原理

3.1 从”每次请示”到”预先规划”

模式	说明
旧模式	AI Agent 每一步都要请示大模型做决定
新模式	Claude 预先把决策路径写进代码，一次性跑完

3.2 压缩多轮调用

原来：多轮 LLM 调用的循环
现在：一次代码执行

3.3 程序化工具调用

Claude 可以：

自动调用工具
解析工具返回的结果
根据条件判断下一步操作
最终把处理好的结果交给 Claude

四、新增功能

功能	说明
代码执行	程序化执行复杂任务
网页抓取	更高效的网页内容提取
记忆	跨会话的记忆能力
搜索	升级后的网页搜索

五、模型知识更新

5.1 Claude Sonnet 4.6 知识截止

知识类型	截止时间
训练知识	2026 年 1 月
可靠知识	2025 年 8 月

5.2 实时程度

2026年2月发布的模型，已经有1月的知识了，基本上到了 T+30 的实时程度。

六、实际效果

6.1 搜索场景

指标	效果
准确率	提升 13%
输入 Token	减少 32%
速度	更快

6.2 潜力

效率提升的潜力非常大
适用于各种复杂任务场景

七、总结

7.1 核心变化

从问答到代码：Claude 工具调用从一问一答变成写代码批量处理
从多轮到一次：多轮 LLM 调用压缩成一次代码执行

7.2 效果

准确率提升：+13%
Token 减少：-32%
更快更准

7.3 意义

这标志着 Claude Agent 能力的重大升级，AI 不再是”每次请示”的执行者，而是能够”预先规划”的自主 Agent。

整理备注

本文档基于群聊分享的 Claude 工具调用升级信息整理，包含核心变化、技术原理、效果对比及模型知识更新说明。