Claude 工具调用重大升级:Agentic Tool Use

Claude 工具调用重大升级:Agentic Tool Use

整理时间: 2026-02-18 23:19
来源: 群聊消息
整理人: AI助手

摘要

Claude 工具调用迎来重大升级,从传统的一问一答模式转变为代码批量处理模式。Claude 可以预先把成百上千种决策路径写进代码里,一次性执行完成,大幅提升效率和准确率。以网页搜索为例,Sonnet 4.6 在 BrowseComp 基准测试上准确率提升 13%,同时输入 token 减少 32%。


一、升级核心变化

1.1 以前的流程(问答模式)

用户提问 → Claude 调用工具 → 拿到结果 → Claude 决定下一步 → 再调用工具 → 循环往复
  • 每次调用工具后都要”回来想一想”
  • 多轮 LLM 调用,效率较低
  • 决策分散在每一轮交互中

1.2 现在的流程(代码模式)

用户提问 → Claude 先写一段代码 → 这段代码自动调用工具、解析结果、根据条件判断下一步操作 → 最终把处理好的结果交给 Claude
  • Claude 提前用代码把各种可能的情况都规划好
  • 一次性执行完毕
  • 不再每次调用工具后都要”回来想一想”

二、核心优势

2.1 效率提升

指标 变化
输入 Token 减少 32%
决策路径 从多轮压缩为一次代码执行
执行方式 成百上千种决策路径预写在代码里

2.2 准确率提升

以网页搜索为例(Sonnet 4.6 + BrowseComp 基准):

指标 提升
准确率 +13%

三、技术原理

3.1 从”每次请示”到”预先规划”

模式 说明
旧模式 AI Agent 每一步都要请示大模型做决定
新模式 Claude 预先把决策路径写进代码,一次性跑完

3.2 压缩多轮调用

  • 原来:多轮 LLM 调用的循环
  • 现在:一次代码执行

3.3 程序化工具调用

Claude 可以:

  • 自动调用工具
  • 解析工具返回的结果
  • 根据条件判断下一步操作
  • 最终把处理好的结果交给 Claude

四、新增功能

功能 说明
代码执行 程序化执行复杂任务
网页抓取 更高效的网页内容提取
记忆 跨会话的记忆能力
搜索 升级后的网页搜索

五、模型知识更新

5.1 Claude Sonnet 4.6 知识截止

知识类型 截止时间
训练知识 2026 年 1 月
可靠知识 2025 年 8 月

5.2 实时程度

2026年2月发布的模型,已经有1月的知识了,基本上到了 T+30 的实时程度。


六、实际效果

6.1 搜索场景

指标 效果
准确率 提升 13%
输入 Token 减少 32%
速度 更快

6.2 潜力

  • 效率提升的潜力非常大
  • 适用于各种复杂任务场景

七、总结

7.1 核心变化

  • 从问答到代码:Claude 工具调用从一问一答变成写代码批量处理
  • 从多轮到一次:多轮 LLM 调用压缩成一次代码执行

7.2 效果

  • 准确率提升:+13%
  • Token 减少:-32%
  • 更快更准

7.3 意义

这标志着 Claude Agent 能力的重大升级,AI 不再是”每次请示”的执行者,而是能够”预先规划”的自主 Agent。


整理备注

本文档基于群聊分享的 Claude 工具调用升级信息整理,包含核心变化、技术原理、效果对比及模型知识更新说明。