AI技术13分钟

Claude 扩展思考模式指南:何时用 Thinking、网页搜索和 Research

这不是一篇停留在 Claude 3.7 发布窗口的功能解读,而是一篇面向当前使用场景的决策指南:帮你判断什么时候打开 Claude 扩展思考,什么时候直接用网页搜索或 Research,以及开发者该如何理解 3.7 与 Claude 4/4.6 的 thinking 差异。

Nano Banana Pro

4K图像官方2折

Google Gemini 3 Pro Image · AI图像生成

已服务 10万+ 开发者
$0.24/张
$0.05/张
限时特惠·企业级稳定·支付宝/微信支付
Gemini 3
原生模型
国内直连
20ms延迟
4K超清
2048px
30s出图
极速响应
Cursor技术团队
Cursor技术团队·AI工作流顾问

Claude 扩展思考模式指南:何时用 Thinking、网页搜索和 Research

如果你现在还把 Claude 的扩展思考理解成“Claude 3.7 发布时那个会把思考过程完整展开的功能”,你今天大概率会在两个地方做错决定。第一个错误是把所有复杂任务都丢给扩展思考,结果明明需要最新网页信息,却还在纯推理模式里兜圈;第二个错误是继续沿用 3.7 时代的开发者心智,以为 Claude 4 也会默认吐出 full thinking,于是接口、流式展示和成本预期都跟着跑偏。

这也是为什么 2026 年再写这篇文章,重点已经不该是“原理有多酷”,而是“这次任务到底该选哪种模式”。Anthropic 当前官方帮助中心已经把答案拆得很清楚:普通聊天、扩展思考、网页搜索和 Research 分别解决不同类型的问题;API 文档则继续把 Claude 3.7、Claude 4 和 Opus 4.6 的 thinking 行为区分开来(Anthropic 帮助中心《When should I use web search, extended thinking, and Research?》,2026-03-19;Claude API Docs《Building with extended thinking》,2026-03-19)。

这篇文章就做一件事:先帮你把模式选对,再帮你把产品端和 API 端的差异一次讲清。

TL;DR

  • 如果你只想先做决定,直接看下文那张 Claude 模式选择矩阵,它就是这篇文章最重要的结论工件。
  • 如果问题不需要最新网页信息,但需要多步推理、拆解约束、自己校验,优先开 扩展思考
  • 如果问题的核心是“现在官方怎么写”“最近发生了什么”“谁刚刚发布了什么”,优先用 网页搜索,不要先把它当成纯 reasoning 题。
  • 如果任务需要跨多个来源做 1-3 分钟的综合整理,直接用 Research;Anthropic 当前说明它默认会同时启用 extended thinking(Anthropic 帮助中心《When should I use web search, extended thinking, and Research?》,2026-03-19)。
  • 如果你在 Claude Web / App 里使用,当前入口是 模型选择器 -> 搜索和工具 -> 扩展思考;如果中途切换开关,会重新开启新对话(Anthropic 帮助中心《使用扩展思维》,2026-03-19)。
  • 如果你在接 API,别再沿用旧教程里的 thinking_mode 心智。当前接口入口是 thinking 对象;Claude 4 默认返回的是 summarized thinking,而不是 3.7 那种 full thinking;Claude Opus 4.6 已经把手动 budget_tokens 模式标记为 deprecated,转向 adaptive thinking(Claude API Docs《Building with extended thinking》,2026-03-19)。
Claude 普通聊天、扩展思考、网页搜索与 Research 的模式选择封面图

为什么今天再看扩展思考,不能只停在 Claude 3.7

扩展思考最早确实是和 Claude 3.7 一起被公开推到前台的。Anthropic 在 2025-02-24 的《Claude’s extended thinking》里,把它描述成一种可以切换开关、也可以让开发者设置 thinking budget 的能力(Anthropic《Claude’s extended thinking》,2026-03-19)。如果你当时第一次接触 Claude,形成“扩展思考 = Claude 3.7 的代表功能”这个印象并不奇怪。

问题在于,这个印象已经不够用了。当前帮助中心写得很明确:扩展思考现在适用于 Claude 4 模型和 Claude 3.7 Sonnet(Anthropic 帮助中心《使用扩展思维》,2026-03-19)。而当前模型总览进一步说明,最复杂任务推荐从 Claude Opus 4.6 开始,所有当前 Claude 模型都支持扩展思考(Claude API Docs《模型概览》,2026-03-19)。也就是说,今天再谈 thinking,你讨论的已经不是一个单独的 3.7 新闻点,而是 Claude 整个模式系统的一部分。

更关键的变化在“你能看到什么”。很多 2025 年的旧文章默认把“完整展示思考过程”写成扩展思考的稳定特征,但 Anthropic 现在在 API 文档里已经区分得非常具体:Claude 4 模型默认返回的是 summarized thinking,而 Claude Sonnet 3.7 才继续返回 full thinking output(Claude API Docs《Building with extended thinking》,2026-03-19)。所以如果你今天还拿 3.7 的可见 thinking 心智去理解 Claude 4,你会把产品体验、调试预期和接口设计全部混成一件事。

这也是旧文章最容易误导人的地方。它们会让你以为扩展思考的核心问题是“性能提升多少”,但今天读者真正面对的其实是另一个问题:同样是 Claude,我这次该继续普通聊天,还是开 thinking,还是直接去搜网页,还是一步到位交给 Research。先把这个问题回答对,后面的原理、预算和模型差异才有意义。

先给结论:普通聊天、扩展思考、网页搜索、Research 怎么选

Anthropic 当前官方帮助已经把边界画得很清楚:网页搜索 适合直接获取最新事实,扩展思考 适合不依赖最新网页信息的复杂推理,Research 适合五次以上工具调用的综合调研,而且默认会同时启用 extended thinking(Anthropic 帮助中心《When should I use web search, extended thinking, and Research?》,2026-03-19)。真正有用的,不是把这三句话背下来,而是把它们变成一次足够快的选择。

我建议你先用一句非常粗暴但非常有效的判断来收束:先看这次任务是否依赖“今天、最近、当前”的网页信息;如果依赖,普通 thinking 不是第一选择。再看这次任务是不是只需要一两次查询就能拿到答案;如果不是,而是要跨多个来源做整合,那就别在网页搜索和手动追问之间来回切,直接上 Research。

Claude 普通聊天、扩展思考、网页搜索与 Research 的选择矩阵图

结合当前官方边界,实际可以先这样选:

模式什么时候优先选它先别急着选它,如果…你通常会得到什么
普通聊天你已经知道问题背景,只需要直接解释、改写、总结、润色或快速互动任务其实要多步推理,或者答案高度依赖最新信息最快的响应和最低的等待成本
扩展思考不依赖最新网页信息,但需要拆解约束、分析方案、调试代码、做长链条推理你真正缺的是“现在的事实”,不是“更深的思考”更慢但更稳的 reasoning 过程
网页搜索你需要一个或几个最近事实,例如官方更新、新闻、价格、文档当前写法任务会跨很多来源、需要系统比较和整理更快拿到最新信息和引用线索
Research你要做的是 1-3 分钟级别的综合整理、跨多个来源比较、生成更长报告你的问题其实一两次搜索就能解决更重但更完整的资料收集与整合

如果你还是拿不准,可以继续用第二层判断。凡是“我已经知道资料在哪里,但需要模型帮我想得更深”的任务,往 thinking 靠;凡是“我连资料本身都还没拿到,或者必须确认现在网页上怎么写”的任务,先往搜索和 Research 靠。把这两个问题分开,你的命中率会比“复杂问题一律开 thinking”高得多。

还有一个现实经验特别值得强调:很多人把“复杂”误解成“都应该开 thinking”。其实不是。一个需要最新价格、最新政策、最新模型版本的任务,哪怕它商业上很复杂,本质上也先是信息获取题;而一个数学证明、代码调试、方案比较,即使话题不大,只要答案主要依赖推理而不是新信息,它就更适合扩展思考。这就是为什么官方会把 web search 和 extended thinking 分成两个入口,而不是让一个开关包打天下。

在 Claude 网页端怎么打开扩展思考,以及什么时候别开

如果你主要在 Claude Web 或 App 里使用,当前官方路径已经非常直接:先在模型选择器里选 Claude 4 模型或 Claude 3.7 Sonnet,再点击左下角的 搜索和工具,然后打开 扩展思考 开关(Anthropic 帮助中心《使用扩展思维》,2026-03-19)。这个设计本身就在提醒你一件事: 扩展思考不是“更高级的默认聊天模式”,而是一个需要按任务打开的专门选项。

打开之后,你会看到 思考中 的状态、计时器,以及一个可展开的 thinking 区域。帮助中心当前说明,用户能看到的是 Claude 的思考过程摘要和问题解决方法(Anthropic 帮助中心《使用扩展思维》,2026-03-19)。这也再次说明,今天产品端的体验重点已经不是“完整暴露每一段原始思考”,而是让你在需要时检查 reasoning 的轮廓。

这里最容易踩的坑,是在一个已经开始的普通对话里临时打开开关,然后以为只是“下一轮更认真一点”。官方当前明确提醒:如果你原本没开扩展思考,后来再打开,会开启新聊天;反过来也一样(Anthropic 帮助中心《使用扩展思维》,2026-03-19)。所以更好的用法不是“聊到一半再试试”,而是在发出请求前先想清楚,这一轮到底是信息检索题、普通对话题,还是 reasoning 题。

什么时候不该开,也比很多教程写得更重要。帮助中心当前列出的“不适合聊天时使用”的场景包括简单问题、基本信息请求和一般写作任务(Anthropic 帮助中心《使用扩展思维》,2026-03-19)。翻译成人话就是:如果你只是要一句定义、一个短建议、一段日常文案,或者一个明显依赖当前网页事实的回答,开 thinking 通常只会增加等待时间,不会明显提升结果质量。

哪些任务最值得开扩展思考,哪些任务不值得等

真正最值得开扩展思考的,不是“看上去高级”的问题,而是那些需要 Claude 自己拆解任务结构的场景。比如你在调一个逻辑 bug,不只是要模型改一行代码,而是要它判断错误根源、验证多个边界条件、比较几种修复路径;又比如你在做一个多约束方案选择,需要同时考虑成本、风险、时间、兼容性和后续迭代空间。这类任务的共通点是:答案不是从网页上直接抓一条事实,而是要在多个约束之间做真正的 reasoning。

第二类特别值得开的场景,是长文档和长上下文分析。你已经把材料拿到了,下一步不是去“找更多资料”,而是要 Claude 帮你消化、分类、指出冲突点、做出建议。在这种时候,扩展思考的价值恰恰在于它能把“看完”变成“想明白”。如果你只用普通聊天,模型往往会给你一个表面总结;开了 thinking,它更有机会把隐藏的矛盾和真正重要的判断前提挖出来。

第三类值得开的场景,是你明确希望模型先反驳自己、再给结论的时候。比如方案评审、路线取舍、风险分析,这些任务最怕“一眼看上去很顺的答案”。扩展思考更适合这种需要自检和多角度检查的工作,因为它天然鼓励模型先把问题拆开,而不是急着给你一个听起来流畅的结论。

但并不是所有“麻烦”的任务都应该开 thinking。最典型的误开场景有三个。第一个是“最近有没有更新”这类问题,它看起来重要,实则先是信息检索题;第二个是短平快的写作和改写任务,你更需要的是响应速度和上下文保持,而不是一段更长的 reasoning;第三个是那些你自己都还没提供足够背景的任务,thinking 不是魔法,它不能弥补输入本身就不完整。

如果你要一句最实用的收束,可以记成这样:扩展思考最适合“资料已在手、答案仍要推理”的任务;网页搜索和 Research 更适合“资料本身还没到位”的任务。只要先把这两种任务分开,你就已经比大多数旧教程更接近今天的正确用法了。

如果你是开发者:Claude 3.7 full thinking、Claude 4 summarized thinking、adaptive thinking 有什么区别

对开发者来说,最容易出问题的不是“有没有 thinking”,而是“虽然 API 形状看起来还在,但行为已经不是同一个时代”。Anthropic 当前文档明确写着:Claude Sonnet 3.7 和 Claude 4 模型的 API shapes 保持一致,但行为不同;Claude 4 默认返回 summarized thinking,Claude Sonnet 3.7 继续返回 full thinking;Claude Opus 4.6 则把手动 thinking: { type: "enabled", budget_tokens: N } 标记为 deprecated,建议改用 adaptive thinking(Claude API Docs《Building with extended thinking》,2026-03-19)。

如果你之前是靠 3.7 的可见 full thinking 来调试 prompt、做演示或者把思考过程直接流给前端,现在最需要调整的不是参数名,而是预期管理。你不应该再默认把“用户能看到完整推理文本”当成 Claude thinking 的普遍行为,而应该把它视为 3.7 时代留下来的特例。

你关心的问题Claude 3.7 SonnetClaude 4 / 4.5Claude 4.6今天该怎么理解
默认看到的 thinkingfull thinking outputsummarized thinkingsummarized thinking3.7 适合兼容旧 full-thinking 心智,Claude 4 以后默认要按摘要 thinking 设计产品
开启方式thinking 对象thinking 对象Opus 4.6 更推荐 adaptive thinking新项目别再围绕旧参数别名或旧教程写法组织代码
预算控制budget_tokensbudget_tokensOpus 4.6 推荐 effort如果你要长期维护,优先跟 4.6 的方向对齐
工具结合可用,但不是当前重点Claude 4 支持 interleaved thinking with tools4.6 继续支持,并进一步靠近 adaptive一旦 thinking 要和 tools 长链路协同,就别再按 3.7 单轮心智设计
适合谁兼容旧代码、调试 legacy full thinking当前主流开发场景最复杂任务与最新能力新工作优先往 Claude 4 / 4.6 收束,3.7 更像兼容层

这一节最重要的不是把所有参数背下来,而是接受一个现实:你今天接 thinking,不是在“复制 3.7 的成功经验”,而是在进入 Claude 4 时代的 thinking 设计。这个变化会影响流式显示、前端文案、日志预期、成本理解,甚至影响你要不要把 thinking 暴露给最终用户。

开发者今天该怎么接:一个够用的迁移顺序

如果你的代码或文档还停在 3.7 时代,我建议不要一上来就大改业务逻辑,而是先按“心智迁移顺序”做收口。第一步,先确认你现有实现到底依赖了什么:是只依赖“更强的 reasoning”,还是额外依赖“用户必须看见完整 thinking 文本”。这两件事在 Claude 4 以后已经不再等价。

第二步,重新决定你的模型起点。Anthropic 当前模型总览的官方推荐是:最复杂任务从 Claude Opus 4.6 开始;如果你需要更偏速度和成本平衡的路线,再看 Sonnet 4.6(Claude API Docs《模型概览》,2026-03-19)。这并不意味着 3.7 不能继续用,而是意味着今天的新工作不该再把 3.7 当作默认起点。

Claude 3.7 到 Claude 4.6 thinking 迁移顺序图

然后再进入真正的实现动作。新的代码路径可以按下面四步收束:

  1. 先把旧教程或旧代码里隐含的 thinking_mode 心智清掉,统一改成围绕当前 thinking 对象来理解接口。
  2. 如果你原本依赖 full thinking 做调试或教学演示,把它明确标记为 Claude 3.7 兼容场景,不要把它当未来默认。
  3. 如果 thinking 会和 tools 长链路协同,优先按 Claude 4 的 interleaved thinking 心智设计,而不是把“开关 thinking”当成单次请求的小补丁。
  4. 如果任务本质上是“先拿最新资料,再做整理”,就别把所有事情都堆到 thinking 上,而是把网页搜索或 Research 放回第一入口。

这样做的好处是,你不会再用“更强 reasoning”掩盖“模式选错”这个更根本的问题。很多开发者以为自己踩的是模型能力坑,其实踩的是工作流分层坑。模式一旦选对,API 接入会比旧教程看上去简单得多。

如果你还在评估 3.7 到 Claude 4 的整体升级背景,可以继续看这篇 Claude 4对比Claude 3.7全面评测。但针对扩展思考这一个能力,最重要的仍然不是“跑分谁更高”,而是你今天该如何把 thinking 放回正确的位置。

常见问题

扩展思考是不是总比普通聊天更好?

不是。官方当前明确把扩展思考定位在复杂推理、规划和分析,而不是所有问题的默认答案(Anthropic 帮助中心《使用扩展思维》,2026-03-19)。如果你的任务只是日常问答、基本信息请求或一般写作,开 thinking 往往只是更慢,不一定更好。

如果问题需要最新信息,还要不要先开扩展思考?

通常不要先把它当作纯 thinking 题。官方当前给出的边界是:网页搜索适合直接获取最新事实,Research 适合更重的多来源综合整理,extended thinking 更适合不依赖最新网页信息的复杂推理(Anthropic 帮助中心《When should I use web search, extended thinking, and Research?》,2026-03-19)。先把“找资料”和“做推理”分开,准确率会更高。

Research 和扩展思考是互斥的吗?

不是。Anthropic 当前帮助中心明确说明,Research 默认会同时启用 extended thinking(Anthropic 帮助中心《When should I use web search, extended thinking, and Research?》,2026-03-19)。你可以把它理解成:当任务已经升级成多来源综合调研时,系统会自动把 deeper reasoning 一起带上。

为什么我在 Claude 4 里看不到 3.7 那种完整 thinking?

因为当前默认行为已经变了。Claude API 文档说明,Claude 4 模型默认返回 summarized thinking,而 Claude Sonnet 3.7 才继续返回 full thinking output(Claude API Docs《Building with extended thinking》,2026-03-19)。所以这不是你“没开对”,而是模型代际差异本身。

API 里今天还应该继续写 thinking_mode 吗?

不应该把它当当前标准心智。你今天应该围绕 thinking 对象来理解接口;而且如果你在用 Claude Opus 4.6,官方已经把手动 budget_tokens 路线标记为 deprecated,并建议转向 adaptive thinking(Claude API Docs《Building with extended thinking》,2026-03-19)。

新项目该先试 Claude 3.7、Claude 4,还是 Opus 4.6?

如果你只是为了兼容旧 full-thinking 逻辑,3.7 还有存在价值;但如果是今天的新项目,官方模型总览的方向已经很清楚:最复杂任务从 Opus 4.6 开始,更追求速度和成本平衡再看 Sonnet 4.6(Claude API Docs《模型概览》,2026-03-19)。从长期维护看,把 3.7 当兼容层,比把它当默认起点更稳妥。

推荐阅读