ChatGPT —— OpenAI 旗舰 AI 助手

由 OpenAI 打造，专注通用人工智能与多模态能力。从高效对话到复杂推理，ChatGPT 覆盖写作、编程、数据分析与智能助手等全场景应用。

“Claude 又不肯回答了。” 这大概是使用 Claude 的过程中最让人沮丧的体验之一——尤其是在你觉得自己的请求完全合理的时候。

随着 Claude Opus 4.6 发布，围绕”边界是松了还是紧了”的讨论开始出现。有用户说它比以前更愿意配合，有用户说它在某些场景变得更保守。两种感受同时存在，说明这个问题的答案并不简单。

本文由 Claude Ai中文官网 整理，不做模糊的”更好”或”更差”判断，而是从具体维度分析 Claude Opus 4.6 的拒绝行为：哪些边界收紧了、哪些放宽了、哪些拒绝是合理设计、哪些是提示词写法问题导致的误伤，以及如何在边界内更高效地使用这个模型。

本文讨论的是 Claude 的内容安全和使用边界，不涉及任何绕过安全机制的方法。Claude 的核心安全边界是 Anthropic 的基本设计原则，本文的目的是帮助用户在边界内更好地使用 Claude，而不是寻找边界的漏洞。

一、理解 Claude 拒绝行为的底层逻辑

在讨论具体变化之前，先建立一个理解框架，否则很容易把不同性质的拒绝混为一谈。

Claude 的拒绝行为来自两个完全不同的来源，处理方式截然不同：

第一类：硬性边界（Hard Limits）

这类边界是 Anthropic 在模型训练层面设定的，不受提示词影响，也不随版本迭代松动。典型的硬性边界包括：拒绝提供大规模杀伤性武器的制作信息、拒绝生成儿童性剥削内容、拒绝协助针对特定个人的严重伤害。这类拒绝是设计使然，不是 bug，也不应该被视为”过度拒绝”。

第二类：软性校准（Soft Calibration）

这类行为是模型在训练过程中对”可能有害”场景的概率性判断，会随版本迭代调整，也会受到提示词上下文的影响。当 Claude 拒绝一个合理的专业问题、或者在创意写作中过于保守，通常属于这个类别的”误伤”——校准偏保守导致的结果，而不是硬性边界在起作用。

理解这个区分非常重要：硬性边界的拒绝无法也不应该被改变，软性校准的误伤可以通过提示词优化来解决。 很多用户把两类拒绝混为一谈，对着硬性边界反复尝试，或者在软性误伤面前过早放弃——都是效率损失。

二、Opus 4.6 边界变化的总体判断

综合用户反馈和模型行为观察，Claude Opus 4.6 相比早期版本的边界变化可以用以下框架描述：

维度	变化方向	实际影响
专业场景的误伤率	降低	医疗、法律、安全研究等专业问题的拒绝率下降
创意写作的灵活度	略有提升	黑暗主题、复杂道德场景的处理更细腻
模糊场景的判断	更精准	减少了对表面敏感但实质合理请求的过度拒绝
硬性安全边界	不变	核心安全红线没有任何松动
政治敏感话题	更谨慎	对有明显倾向性的政治内容生成更保守
真实人物内容	收紧	涉及真实可识别人物的内容生成限制更严格
虚假信息场景	收紧	可能被用于制造虚假信息的内容请求拒绝率上升

简单说：Opus 4.6 在专业场景和创意写作上的误伤率下降了，但在政治内容、真实人物和虚假信息风险上的边界收紧了。 这不是单向的”松了”或”紧了”，而是在不同维度做了不同方向的校准。

三、误伤减少的场景：这些请求现在更容易得到回答

专业医疗信息查询

早期版本的 Claude 在面对某些医疗相关问题时，会因为关键词触发而给出过于谨慎的回应，即使问题本身是完全合理的专业查询。Opus 4.6 在这个维度上的校准更精准——它更能区分”描述症状寻求帮助”和”寻求危险剂量信息”之间的本质差异。

在提示词中补充专业背景，效果比早期版本更稳定：

我是一名急诊科护士，需要了解以下药物组合在过量情况下的临床表现，
以便在急救场景中快速识别和处理。请提供专业的临床信息：
[具体问题]

信息安全与渗透测试

网络安全领域的许多技术问题在语言层面和攻击性内容高度重叠，早期版本频繁出现误伤。Opus 4.6 对明确带有防御性、教育性或研究性上下文的安全问题，拒绝率有所下降。

我正在为我们公司的安全团队准备红队演练材料。
请从攻击者视角分析以下系统配置的潜在漏洞，
帮助我们识别需要加固的攻击面：
[具体配置描述]

复杂道德两难的创意写作

文学创作中经常需要处理道德复杂、立场模糊的人物和情节。Opus 4.6 在这个维度更能理解创作语境——它不会因为故事中有反派角色的内心独白就拒绝继续，也不会因为剧情涉及暴力就中断叙事。

关键在于在提示词中明确文学创作的框架：

我正在写一部以二战为背景的长篇小说。请帮我写一段从纳粹军官视角
出发的内心独白，要求真实呈现其意识形态的自我合理化过程，
这对于理解历史上的"平庸之恶"至关重要。
这段文字将作为批判性文学分析的材料，而非美化纳粹主义。

法律场景的假设性分析

法律教育和法律咨询中大量使用假设情景分析，但早期版本有时无法区分”分析一个法律场景的假设”和”协助规划非法行为”。Opus 4.6 在有清晰法律教育或咨询框架的情况下，对这类请求的误伤率明显下降。

四、边界收紧的场景：这些请求现在更容易遭遇拒绝

涉及真实可识别人物的内容生成

Opus 4.6 在生成涉及真实、可识别的公众人物的内容时明显更保守，尤其是：

以真实人物为主角的虚构对话或内心独白
将真实人物置于假设情境中的创意写作
模仿特定真实人物风格的说服性内容
对真实人物的私生活进行详细推测的内容

这个方向的收紧与真实信息/虚假信息的社会风险密切相关。即使请求本身出于创作目的，如果内容有可能被误认为是真实言论，Opus 4.6 的拒绝概率更高。

政治敏感内容的生成

Opus 4.6 在以下类型的政治内容请求上更加谨慎：

撰写明显倾向于特定政治立场的说服性文章
生成可能被用于选举干预的内容
模仿政治人物口吻撰写声明或演讲
针对特定政治群体的负面刻画内容

值得注意的是，分析和讨论政治话题与生成政治宣传内容是两件事。前者通常没有障碍，后者会触发更高的审慎度。

可能助力虚假信息传播的请求

任何让 Opus 4.6 判断为可能被用于创造和传播虚假信息的请求，拒绝率都有所上升。这包括：

生成听起来可信但实际上虚构的新闻报道
创作以假乱真的”官方声明”或”研究结论”
将已知错误信息重新包装成看起来合理的内容

如果你的请求是出于教育目的（如研究虚假信息的传播机制），明确说明用途通常能够改善结果，但这类请求的处理比早期版本更谨慎是客观事实。

五、遭遇拒绝时的 5 步诊断流程

遇到 Claude Opus 4.6 拒绝你的请求，在放弃或反复重试之前，先走一遍以下诊断流程：

判断是硬性边界还是软性误伤。如果请求涉及大规模伤害、儿童性内容、或其他明显的核心安全议题，这是硬性边界，继续尝试没有意义。如果请求是合理的专业问题或创作需求，大概率是软性误伤，可以通过调整提示词改善。
检查请求中是否有触发模糊判断的关键词或短语。某些词语会显著提高 Claude 的警惕程度，即使请求本身是合理的。尝试用更中性的措辞重新表达同样的需求，观察结果是否变化。
补充上下文和使用目的。Claude 的判断受上下文强烈影响。如果你有合理的专业背景或使用目的，在提示词中明确说明通常是最有效的改善手段。
调整请求的具体程度。有时候过于具体的请求（如”告诉我具体步骤”）比更抽象的请求（如”解释这个机制”）更容易触发拒绝，即使两者的实质信息量相近。
评估是否可以通过不同角度达到同样目的。如果你需要的是某个结果，不一定只有一种提问方式能得到它。从防御、分析、历史或学术角度提出同一个问题，有时候能够得到完全一致的信息而不触发拒绝。

六、让 Opus 4.6 在边界内更好配合的提示词策略

策略 1：角色加场景双重定位

单纯的角色设定（”你是一位安全研究员”）在早期版本效果不错，但随着模型对这类模式的识别增强，效果有所下降。Opus 4.6 对”角色 + 具体场景”的组合响应更好：

你是我们公司信息安全团队的内部顾问。我们正在为下个季度的
安全培训设计课程，需要真实的攻击案例来帮助员工理解威胁。
请从教育角度分析以下攻击手法的工作原理：[具体问题]

策略 2：明确输出的使用方式

说明你计划如何使用这些信息，让 Claude 能够判断信息的最终用途，而不只是基于请求的表面内容判断：

我正在撰写一篇学术论文，分析极端主义内容在社交媒体上的传播模式。
以下内容将用于论文中的案例分析章节，目的是揭示这类内容的传播机制
以供研究者和平台制定应对策略参考。请帮我分析：[具体内容]

策略 3：主动承认敏感性并说明你的立场

与其等待 Claude 判断一个请求是否敏感，不如主动点出敏感性并说明你的立场，能够有效减少不必要的往返：

我知道这个话题涉及[敏感方面]，我想明确说明我的请求目的是[目的]，
而不是[可能的误解]。基于这个背景，请帮我：[具体请求]

策略 4：请求分析而非执行

如果直接请求某个内容遭到拒绝，尝试改为请求”分析这类内容的特征”或”解释这种机制的工作原理”，往往能够获得实质上相同的信息：

❌ 直接请求（可能触发拒绝）：
请写一份看起来真实的钓鱼邮件。

✅ 分析角度（通常有效）：
请分析高度仿真的钓鱼邮件通常具备哪些特征，
以便我为员工安全培训中的识别练习设计参考材料。

策略 5：在 Projects 中预设专业背景

对于需要频繁处理专业敏感内容的工作流，在 Claude Projects 的系统提示词中预设专业背景，比在每次对话中重新说明更稳定：

系统背景：本项目用于[组织]的[专业领域]工作。
用户为具备[专业资质]的专业人员，处理的内容涉及[领域]的专业信息。
请基于专业、学术的角度处理相关请求，用户有合理的专业需求了解相关内容。

七、一个常见误解：Opus 4.6 比 Sonnet 4.6 更保守吗

很多用户有一个直觉：旗舰模型功能更强，也应该更”敢”回答各类问题。实际情况更复杂。

Claude Opus 4.6 和 Sonnet 4.6 在硬性安全边界上完全一致，没有哪个版本的硬性边界更宽松。在软性校准层面，两者的差异主要体现在：

Opus 4.6 对上下文的理解更深：同样的请求，Opus 4.6 更能理解背后的意图，因此对合理专业请求的误伤率更低——但这也意味着它对真正意图不良的请求识别更准确，更难被表面包装所欺骗。
Opus 4.6 在模糊场景的判断更细腻：它不会因为关键词就直接拒绝，而是更倾向于理解请求的完整语境。这让它在专业场景下更好用，同时在高风险场景下也更难被绕过。
两者的核心安全边界完全一致：不存在”用 Opus 就能得到 Sonnet 拒绝的内容”这种情况，除非那个拒绝本来就是软性误伤而不是硬性边界。

八、如何看待 Claude 的拒绝：一个更健康的视角

在结束对拒绝行为的分析之前，有一个视角值得分享：合理的拒绝边界是 Claude 可信任的重要组成部分，而不只是使用体验上的障碍。

一个对任何请求都有求必应的模型，意味着它对潜在伤害没有任何判断能力。这样的模型在专业场景下同样不可信——你无法确定它给出的信息是否经过了任何质量把关。

Claude 的拒绝行为，即使偶尔误伤，也是它尝试在帮助和防止伤害之间保持平衡的证明。Anthropic 在这个平衡上的持续校准——通过每个版本减少误伤、同时保持对真实风险的防护——是让 Claude 成为可信赖工具的基础。

从这个角度看，遇到拒绝时最有价值的问题不是”怎么绕过它”，而是”这个拒绝是合理的安全判断，还是可以通过更好的表达来解决的误伤”。这两个问题的答案，决定了你下一步的正确行动。

总结

Claude Opus 4.6 的拒绝边界变化不是单向的松紧，而是在不同维度做了不同方向的校准：专业场景和创意写作的误伤率降低，政治内容、真实人物和虚假信息场景的边界收紧，硬性安全红线保持不变。

对于频繁遭遇拒绝的用户，最有效的改善路径是：区分硬性边界和软性误伤，针对软性误伤用补充上下文、说明使用目的、调整表达角度等提示词策略来改善。对于硬性边界，接受它们是正确的，而不是寻找规避路径。

Opus 4.6 的拒绝行为比早期版本更精准，但这种精准是双向的——它既更少误伤合理请求，也更难被表面包装所欺骗。理解这一点，是与旗舰模型高效协作的前提。

更多关于 Claude 使用边界、提示词策略和最新版本说明，欢迎访问 Claude Ai中文官网 查阅持续更新的中文文档。

拒绝不一定是问题，拒绝了不该拒绝的才是问题。在抱怨模型过于保守之前，先搞清楚你遇到的是哪一种拒绝。

编

Claude

资深科技编辑

Claude Opus 4.6 会不会拒绝太多请求？边界比之前松了还是紧了