📌 内容摘要

  • Claude 4 系列已发布三款模型:Haiku 4.5(2025年11月)、Opus 4.6(2026年2月5日)、Sonnet 4.6(2026年2月17日)。
  • 3月14日重大更新:Opus 4.6 和 Sonnet 4.6 的 1M token 上下文正式转为标准定价,不再收取溢价。
  • 核心新特性:自适应推理、Agent Teams、Context Compaction、128K 输出、Claude in PowerPoint。
  • Claude 3 Sonnet 3.7 和 Haiku 3.5 已于2026年3月正式退役,建议迁移至 Claude 4 系列。

一、Claude 4 系列发布时间线

从2025年11月到2026年3月,Claude 4 系列在短短4个月内完成了完整的产品矩阵布局。以下是完整发布记录:

发布日期 模型 核心更新 API 定价(输入/输出)
2025年11月 Claude Haiku 4.5 最快轻量模型,代码能力追平 Sonnet 4 $1 / $5
2026年2月5日 Claude Opus 4.6 1M 上下文、自适应推理、Agent Teams、128K 输出 $5 / $25
2026年2月17日 Claude Sonnet 4.6 全面升级代码、Agent、长上下文推理、设计能力 $3 / $15
2026年3月14日 重大定价更新 Opus 4.6 + Sonnet 4.6 的 1M 上下文正式转标准定价 无溢价(统一标准价)

二、2026年2月:Opus 4.6 发布——旗舰升级

发布背景

2026年2月5日上午,Anthropic 发布 Claude Opus 4.6,这是 Opus 系列首次支持百万级上下文窗口,也是 Anthropic 迄今在代码能力和 Agent 自主性上最大的一次跃升。有趣的是,发布仅20分钟后,OpenAI 随即推出了 GPT-5.3 Codex,两家公司之间的正面竞争愈发激烈。

核心新特性

自适应推理(Adaptive Thinking)
取代了之前需要手动开启的 Extended Thinking,Claude 现在可以自动判断何时需要深度推理。提供四个努力等级(low / medium / high / max),默认为 high,在高强度模式下几乎对每个问题都会主动进行深度思考,同时对简单问题智能跳过,节省 token 消耗。

1M Token 上下文(Beta → 3月正式)
Opus 4.6 首次将百万级上下文带入 Opus 系列。在 MRCR v2 长文本检索基准中得分 78.3%(1M token),远超前代 Sonnet 4.5 的 18.5%。困扰开发者已久的”上下文衰减”问题在 Opus 4.6 中得到根本改善。

Agent Teams(多 Agent 团队协作)
以研究预览形式随 Claude Code 推出。允许多个 Claude 实例并行协作:一个”主导 Agent”统筹调度,多个”队友 Agent”并发处理不同子任务,每个实例拥有独立上下文窗口。Anthropic 研究员在内部用 16 个 Opus 4.6 Agent 从零写出了一个能编译 Linux 内核的 C 编译器(约 10 万行代码),实验成本约 $20,000。

Context Compaction(上下文压缩)
当对话接近 token 上限时,API 自动将历史内容压缩成摘要,释放空间继续运行——理论上实现无限长度对话,专为长时间运行的 Agent 任务设计。

128K 最大输出
输出上限从上一代的 64K 翻倍至 128K token,覆盖超长代码生成、详细研究报告等场景。

Claude in PowerPoint 上线
Claude 正式作为插件进入 PowerPoint,可直接在 PPT 中生成、编辑幻灯片内容,自动匹配现有颜色、字体和布局风格。同步更新了 Claude in Excel,升级至 Opus 4.6 并支持原生 Excel 操作(如透视表编辑、条件格式化)。

基准测试成绩(2026年2月)

测试项目 Opus 4.6 Opus 4.5(上代) 说明
Terminal-Bench 2.0 65.4%(第一) 自主 Agent 代码能力
SWE-bench Verified 80.8% 80.9% 真实 GitHub Issue 修复
ARC-AGI-2 68.8% 37.6% 纯逻辑推理,几乎翻倍
GDPval-AA Elo 1606(第一) 1416 金融法律等真实办公任务
MRCR v2(1M 上下文) 78.3% 长文本多针检索

开发者注意:Breaking Change
Opus 4.6 不再支持 Assistant Message Prefilling,发送包含 prefill 的请求会直接返回 400 错误。需迁移至结构化输出(Structured Outputs)或通过 System Prompt 控制输出格式。模型 ID 为 claude-opus-4-6(无日期后缀)。

三、2026年2月17日:Sonnet 4.6 发布——首次追平 Opus

Sonnet 4.6 是整个 Claude 4 系列中最值得普通用户关注的一次发布。这是史上第一次,Sonnet 级别的模型在编程评测中被 70% 的开发者选为优于上一代 Opus(Opus 4.5)——也就是说,$3 的 Sonnet 实现了之前需要花 $5 才能实现的效果。

Sonnet 4.6 的主要升级包括:代码、计算机操控(Computer Use)、长上下文推理、Agent 规划、知识工作和设计能力的全面提升;支持 1M token 上下文(发布时为 Beta,3月正式转标准定价);64K 最大输出;同步接入自适应推理和努力等级控制。定价维持与 Sonnet 4.5 相同的 $3/$15。

发布后,Sonnet 4.6 成为 Claude.ai 免费版和 Pro 版的默认模型,也是 Claude Code 的日常主力推荐。

四、2026年3月14日:1M 上下文统一标准定价——最重要的一次更新

这是3月份最值得关注的更新,影响所有 API 用户的成本结构。

此前,当请求超过 200K token 时,Opus 4.6 和 Sonnet 4.6 会触发长上下文溢价(输入 2x、输出 1.5x)。3月14日起,Anthropic 正式宣布:对 Opus 4.6 和 Sonnet 4.6,1M token 范围内统一按标准定价计费,不再区分 200K 以内和以上。

实际影响:一个 90 万 token 的请求,现在与一个 9000 token 的请求按完全相同的单价计费。这对以下场景的成本影响最为显著:

  • 完整代码库分析(通常超过 200K token)
  • 长时间运行的 Agent 循环
  • 整份法律合同或研究报告的单次处理

同步更新:Claude Code 的 Max、Team、Enterprise 用户默认获得 1M token 上下文,Context Compaction 触发频率降低约 15%。每次请求支持上传的媒体数量上限从 100 个提升至 600 个图片或 PDF 页面。

五、其他重要更新(2026年2-3月)

Microsoft 365 Copilot 集成(3月9日)
微软宣布将 Anthropic 最新 Claude Sonnet 系列模型开放给 M365 Copilot 用户使用,将 Claude 的能力带入 Word、Excel、Teams 等企业办公套件。

Claude Code Security 上线(2月)
Anthropic 推出 Claude Code Security 功能,可对整个代码库进行安全审查,自动识别漏洞,这是 Claude Code 在安全领域的重要延伸。

自动缓存(Automatic Caching)正式发布
Messages API 新增自动缓存功能:只需在请求体中添加一个 cache_control 字段,系统自动缓存最后一个可缓存块,随对话增长自动移动缓存点,无需手动管理断点。对高频调用的应用可节省最多 90% 的输入 token 成本。

企业版自助购买开放
Enterprise 计划此前仅限通过 Anthropic 销售团队购买,现已开放自助在线购买,任何组织无需销售沟通即可直接订阅。

旧模型退役提醒
Claude Sonnet 3.7(claude-3-7-sonnet-20250219)和 Claude Haiku 3.5(claude-3-5-haiku-20241022)已于2026年3月正式退役,请求将返回错误。官方建议迁移至 Claude Sonnet 4.6 和 Claude Haiku 4.5。Claude Haiku 3(claude-3-haiku-20240307)已宣布将于2026年4月19日退役。

六、Claude 4 系列当前完整规格

模型 上下文 最大输出 API 输入 API 输出 状态
Claude Opus 4.6 1M(正式) 128K $5.00/M $25.00/M 现役旗舰
Claude Sonnet 4.6 1M(正式) 64K $3.00/M $15.00/M 默认主力
Claude Sonnet 4.5 200K(1M Beta) 64K $3.00/M $15.00/M 仍可用
Claude Haiku 4.5 200K 16K $1.00/M $5.00/M 轻量首选

数据来源:Anthropic 官方 API 文档及定价页,2026年3月22日

总结

Claude 4 系列在短短4个月内完成了从轻量到旗舰的完整布局,而3月14日的 1M 上下文统一标准定价更新,是对所有 API 用户成本影响最直接的一次改变。对于开发者来说,当前最优选择是:日常任务用 Sonnet 4.6($3/$15,1M 上下文,免费可用);复杂 Agent 和大型代码库分析用 Opus 4.6($5/$25,128K 输出);高频轻量任务用 Haiku 4.5($1/$5)。

还在使用 Sonnet 3.7 或 Haiku 3.5 的开发者请尽快迁移——这两款模型已于2026年3月正式退役,继续调用将返回错误。