如果你的项目正在使用 Claude Sonnet 4 或 Claude Sonnet 4.5 的 100 万 Token 超长上下文功能,有一个截止日期你需要立刻写进日历:2026 年 4 月 30 日

Anthropic 宣布将于 2026 年 4 月 30 日停止对 Claude Sonnet 4.5 和 Claude Sonnet 4 的 1M Token 上下文窗口 Beta 的支持。在此日期之后,context-1m-2025-08-07 Beta Header 在这两个模型上将不再生效,超出标准 200K Token 上下文窗口的请求将返回错误。

本文由 Claude Ai中文官网 整理,说明这次变更的影响范围、迁移路径、代码改动要求,以及背后的背景逻辑。

本文信息来自 Anthropic 官方 API 文档和发布说明,以截至 2026 年 4 月 5 日的最新内容为准。如有调整,以官方文档为准。

一、受影响的范围:谁需要采取行动

以下情况需要在 4 月 30 日之前完成迁移,否则你的请求将开始返回错误:

  • API 请求中携带了 anthropic-beta: context-1m-2025-08-07 Header
  • 并且使用的模型是 claude-sonnet-4-5claude-sonnet-4-20250514(Sonnet 4)
  • 并且请求的输入 Token 数量超过 200,000

如果你满足以上三个条件,4 月 30 日之后超出 200K 的请求将报错,需要提前完成迁移。

以下情况不受影响,无需任何操作:

  • 使用 Sonnet 4 或 Sonnet 4.5 但请求从未超过 200K Token
  • 已经在使用 claude-sonnet-4-6claude-opus-4-6
  • 携带了 Beta Header 但实际 Token 用量始终在 200K 以内

二、迁移路径:切换到哪个模型

Anthropic 给出的官方迁移建议是明确的:要继续使用 1M Token 上下文窗口,请迁移到 Claude Sonnet 4.6 或 Claude Opus 4.6,这两款模型在标准定价下原生支持完整的 1M Token 上下文窗口,无需任何 Beta Header。

迁移目标 定价(输入/输出 每百万 Token) 1M 上下文支持方式 适合场景
Claude Sonnet 4.6 $3 / $15 原生支持,无需 Beta Header,标准定价全覆盖 高频调用、日常开发、Agent 任务
Claude Opus 4.6 $5 / $25 原生支持,无需 Beta Header,标准定价全覆盖 复杂推理、工程编码、高精度任务

Claude Opus 4.6 和 Sonnet 4.6 现在以标准定价提供完整的 1M Token 上下文窗口。标准定价适用于整个窗口——Opus 4.6 为每百万 Token $5/$25,Sonnet 4.6 为 $3/$15。没有乘数:90 万 Token 的请求与 9 千 Token 的请求按相同的每 Token 费率计费。

对于大多数之前使用 Sonnet 4.5 + 1M Beta 的场景,Sonnet 4.6 是最自然的迁移目标——价格相同($3/$15),能力更强,且 1M 上下文已经是正式功能而非 Beta。

三、代码迁移:需要改什么

好消息是:代码改动量非常小,核心只有两处。

改动 1:更新模型名称

# 迁移前(需要在 4 月 30 日前完成迁移)
model = "claude-sonnet-4-5"         # 或 "claude-sonnet-4-20250514"

# 迁移后
model = "claude-sonnet-4-6"         # 推荐:价格相同,能力更强
# 或
model = "claude-opus-4-6"           # 如果需要更强推理能力

改动 2:移除 Beta Header(可选但推荐)

import anthropic

client = anthropic.Anthropic()

# 迁移前(使用 Sonnet 4.5 + Beta Header)
response = client.beta.messages.create(
    model="claude-sonnet-4-5",
    max_tokens=4096,
    betas=["context-1m-2025-08-07"],   # 迁移后可以移除这行
    messages=[
        {"role": "user", "content": "[超长内容,超过 200K Token]"}
    ]
)

# 迁移后(使用 Sonnet 4.6,无需 Beta Header)
response = client.messages.create(    # 注意:不再需要 beta.messages
    model="claude-sonnet-4-6",
    max_tokens=4096,
    # 不需要任何 betas 参数
    messages=[
        {"role": "user", "content": "[超长内容,超过 200K Token]"}
    ]
)

关于移除 Beta Header 的注意事项:如果你已经在发送 Beta Header,它将被忽略,因此不需要修改代码。 换言之,在迁移到 Sonnet 4.6 之后,即使你暂时没有删掉旧的 context-1m-2025-08-07 Header,也不会报错——但建议在完成迁移后清理掉这个无效 Header,保持代码整洁。

完整迁移示例

import anthropic

client = anthropic.Anthropic()

def analyze_long_document(document_content: str) -> str:
    """
    长文档分析函数——迁移后的版本。
    Sonnet 4.6 原生支持 1M Token,无需 Beta Header,无额外定价。
    """
    response = client.messages.create(
        model="claude-sonnet-4-6",   # 从 sonnet-4-5 迁移到 sonnet-4-6
        max_tokens=4096,
        # 无需 betas=["context-1m-2025-08-07"]
        system="你是专业的文档分析助手,请基于提供的文档内容准确回答问题。",
        messages=[
            {
                "role": "user",
                "content": f"请分析以下文档的核心内容:\n\n{document_content}"
            }
        ]
    )
    return response.content[0].text

四、为什么 Anthropic 要退出这两款模型的 Beta 支持

这次变更的背景逻辑并不复杂:Beta 功能已经在更新的模型上正式化,没有必要继续在旧模型上维护 Beta 通道。

Sonnet 4.6 和 Opus 4.6 的 1M Token 上下文窗口现在已正式上线,在 Claude 平台原生可用。 当正式版本已经存在,继续维护旧模型的 Beta 版既增加了工程负担,也可能让部分开发者继续使用功能和能力均不如新版的旧模型。

从时间线上看,这是一个有序的迭代过程:

  • 2025 年 8 月:1M Token 上下文以 Beta 形式引入 Sonnet 4 和 Sonnet 4.5
  • 2026 年 2 月:Sonnet 4.6 和 Opus 4.6 发布,1M 上下文在这两款模型上仍为 Beta
  • 2026 年 3 月 13 日:1M 上下文在 Sonnet 4.6 和 Opus 4.6 上正式上线(GA),无需 Beta Header,标准定价全覆盖
  • 2026 年 4 月 30 日:Sonnet 4 和 Sonnet 4.5 的 1M Beta 支持正式退出

这个节奏留给了开发者约两个月的迁移窗口——从 3 月 13 日正式版上线到 4 月 30 日 Beta 退出。

五、迁移到 Sonnet 4.6 的额外收益

这次迁移不只是”被迫升级”,从 Sonnet 4.5 切换到 Sonnet 4.6 本身也带来了实质性的能力提升。

在编程能力上,Sonnet 4.6 在 SWE-bench Verified 上得分 79.6%,比 Sonnet 4.5 的 77.2% 高出 2.4 个百分点。在 Agent 场景中,Sonnet 4.6 在 OSWorld-Verified 计算机使用基准上得分 72.5,而一年前 Sonnet 3.7 在同类基准上仅为 28.0。 这 2.5 倍的提升意味着自动化工作流的可靠性有了本质性改善。

在长上下文召回质量上,Opus 4.6 在 1M Token 下的 MRCR v2 基准得分 78.3%,而同等上下文长度下 Gemini 3 Pro 为 26.3%,之前最佳 Claude 模型约为 18.5%。 Sonnet 4.6 在相应基准上的表现同样明显优于上代——这意味着你放进去的超长内容,模型能够更准确地”记住”并利用。

此外,Sonnet 4.6 还引入了 Adaptive Thinking(自适应思考)模式,以及改进的 Agent 搜索性能。对于之前在 Sonnet 4.5 上用 1M 上下文跑 Agent 任务的场景,升级后的整体体验会有可感知的提升。

六、常见问题

Q:4 月 30 日之后,如果我的代码还在用 Sonnet 4.5 + Beta Header,会发生什么?

A:如果你的请求超过 200K Token,将返回错误。如果请求始终在 200K 以内,context-1m-2025-08-07 Header 将被忽略,不会报错,但你实际上没有在用 1M 上下文(因为 Sonnet 4.5 的标准窗口是 200K)。

Q:迁移到 Sonnet 4.6 会涨价吗?

A:不会。Sonnet 4.6 与 Sonnet 4.5 定价相同,均为 $3/$15 每百万 Token。而且 Sonnet 4.6 的 1M 上下文在标准定价内全覆盖,没有超出 200K 的额外溢价,实际上比 Sonnet 4.5 Beta 期间的长上下文定价更便宜。

Q:迁移前需要测试 Sonnet 4.6 的输出质量吗?

A:建议做一次回归测试,尤其是如果你的工作流依赖 Claude 特定的输出格式或风格。整体来看 Sonnet 4.6 的质量优于 Sonnet 4.5,但不同任务类型的体感差异可能不同,测试能帮你确认无回归。

Q:同时使用 Claude Sonnet 4.5 但请求从未超过 200K,需要迁移吗?

A:不需要立刻迁移。但需要注意的是,Claude Sonnet 4.5 本身也在 Anthropic 的计划弃用列表中,建议在合适的时间窗口内完成向 Sonnet 4.6 的迁移,避免日后面临更紧迫的升级压力。

Q:AWS Bedrock 和 Google Vertex AI 上的 Claude 也受影响吗?

A:1M 上下文现在在 Claude 平台原生可用,以及通过 Amazon Bedrock、Google Cloud 的 Vertex AI 和 Microsoft Foundry 使用。 对应平台上的 Sonnet 4.5 Beta 同样按相同时间表停止支持,迁移建议同样适用。建议查阅对应云平台的最新文档确认具体执行时间。

七、迁移检查清单

在 4 月 30 日之前,按以下顺序确认迁移完成:

  1. 排查所有使用 claude-sonnet-4-5claude-sonnet-4-20250514 的 API 调用,确认是否携带了 context-1m-2025-08-07 Beta Header 且请求可能超过 200K Token
  2. 将受影响的调用的模型名称更新为 claude-sonnet-4-6
  3. 移除 betas 参数中的 context-1m-2025-08-07 条目(Sonnet 4.6 不需要此 Header)
  4. 在测试环境验证迁移后的调用,确认超长请求能正常返回结果
  5. 部署到生产环境,监控错误率确认无异常

总结

这次变更影响的是一个相对小众的使用场景——同时满足”旧版 Sonnet”+”长上下文 Beta”+”超过 200K 请求”三个条件的开发者。但如果你恰好在这个场景里,4 月 30 日的截止日期不容忽视:届时超出 200K 的请求将直接报错,影响生产环境。

迁移本身的工程成本很低:改一行模型名称,移除一个 Beta Header。Sonnet 4.6 不仅完全覆盖了旧版的 1M 上下文能力,还在编程能力、Agent 性能和长上下文召回质量上有实质性提升,且价格完全相同。这是一次代价几乎为零、收益明确的版本升级。

更多关于 Claude API 模型迁移、定价和最新功能说明,欢迎访问 Claude Ai中文官网 查阅持续更新的中文开发者文档。

Beta 功能退出是 GA 正式上线的另一面——当旧路关闭,更好的新路早已开通。