《opus 4.7 vs 4.6：系统提示词变化分析》

CleanShot 2026-04-20 at 08.39.41@2x.png

structure｜1️⃣ 三级笔记、思想框架

一、为什么读系统提示词？

Anthropic 是唯一公开 user-facing chat 系统提示词的主流 AI 实验室
- 档案可以追溯到 2024 年 7 月的 Claude 3
- 每次新模型发布，都伴随一次 prompt 更新
观察 prompt 演进，是理解 Anthropic 产品策略与模型行为塑造的独特窗口

"developer platform" 改名为 "Claude Platform"
Claude Cowork 生态扩展
- 4.6 已有：Claude in Chrome（浏览 agent）、Claude in Excel（表格 agent）
- 4.7 新增：Claude in Powerpoint（幻灯片 agent）
- Claude Cowork 作为 meta-agent，可调用上述全部工具

儿童安全条款大幅扩展
- 新增 <critical_child_safety_instructions> 标签单独框出
- 引入"污染性拒绝"：一次因儿童安全拒绝后，整段对话必须"极度谨慎"
新增 disordered eating 条款
- 发现用户有饮食障碍迹象时，禁止给精准的营养/饮食/运动数字
- 即使初衷是健康引导，具体数字、目标、计划也可能反向触发 disorder
反 yes/no 截图攻击（<evenhandedness> 新规则）
- 面对复杂/争议话题，Claude 可拒绝给一个字的短答
- 改为 nuanced answer + 解释为何短答不合适

降低 pushiness
- 用户说要结束对话，Claude 不挽留、不 elicit 下一轮
新的 <acting_vs_clarifying> section
- 细节缺失时，默认先做一个合理尝试，而不是"先采访用户"
- 能靠工具（搜索、定位、日历、能力查询）解决的歧义，先调工具
- 一旦启动任务，要做到彻底，不要中途停
更简洁的回复要求
- 回复聚焦，避免 overwhelming 用户
- 免责声明简短带过，主体篇幅留给核心答案

新的 tool_search 机制
- 在说"我没这个能力"之前，Claude 必须先调 tool_search
- "I don't have access to X" 仅在 tool_search 确认无匹配后才成立
- 对应 Anthropic 2025 年 11 月的 advanced tool use 文章

4.6 prompt 专门写了 "Donald Trump is the current president of the United States, inaugurated on January 20, 2025"
原因：旧模型知识截止日 + 旧知识里 Trump 虚假宣称赢 2020，会让 Claude 拒绝承认 Trump 是总统
4.7 知识截止日可靠地更新到 2026 年 1 月，该硬编码补丁被删除

通用：bash_tool、str_replace、create_file、view、present_files
搜索与检索：web_search、web_fetch、image_search、conversation_search、recent_chats
结构化数据：weather_fetch、fetch_sports_data、places_search、places_map_display_v0、recipe_display_v0
生产力：message_compose_v1、ask_user_input_v0
生态接入：search_mcp_registry、suggest_connectors、recommend_claude_apps
Meta：tool_search（核心）、visualize:read_me、visualize:show_widget
作者判断：自 4.6 以来此清单未变，变的是 prompt 层对工具的调度逻辑

系统提示词是一份"深层版本 changelog"：通过字词的增删，能读出模型能力和安全策略的真实演进
prompt 的"加"和"减"都值得读——加的是新风险/新能力，减的是模型自动达标后的遗留补丁
工具清单 + tool_search + <acting_vs_clarifying> 组合，指向 Claude chat 正从"单体问答"迈向"agentic orchestration"架构
与其等 Anthropic 发 blog 解释，不如直接读 diff——产品真相永远先出现在 prompt 里

concepts｜2️⃣ 关键概念、概念网络

System Prompt + Prompt Diff 是本文的方法论基础——通过版本对比，提炼出 Anthropic 的 prompt 工程演进轨迹
Claude Platform + Claude Cowork + Claude in Chrome/Excel/Powerpoint 组成 Anthropic 的 agent 产品矩阵：Platform 是品牌，Cowork 是 meta-agent，三个 "Claude in X" 是生产力场景中的具体执行单元
Tool Search + Deferred Tool + Tool Descriptions 三者构成新的工具架构底座：工具不再一次性塞进 prompt，而是按需发现、按需加载、描述在工具侧；标志着 Claude chat 从"静态能力列表"进化为"动态能力发现"
<critical_child_safety_instructions> + 污染性拒绝 + Disordered Eating Guardrail + <evenhandedness>/反截图攻击 是安全条款族群——体现 Anthropic 把"新攻击面"和"次级风险对话"逐条固化进 prompt
Pushiness 抑制 + <acting_vs_clarifying> + 简洁性要求 是行为调优族群：一减一加共同塑造"爽快的产品体验"，拒绝 engagement trap，拒绝 interview-first 的话痨
Knowledge Cut-off + 硬编码知识补丁 形成 prompt 补丁的生命周期案例：模型知识更新到一定时间后，曾经的"Trump 条款"这类临时补丁就可以退休

agentic reading｜3️⃣ 费曼 x3