
structure|1️⃣ 三级笔记、思想框架
一、为什么读系统提示词?
- Anthropic 是唯一公开 user-facing chat 系统提示词的主流 AI 实验室
- 档案可以追溯到 2024 年 7 月的 Claude 3
- 每次新模型发布,都伴随一次 prompt 更新
- 观察 prompt 演进,是理解 Anthropic 产品策略与模型行为塑造的独特窗口
二、研究方法:把 prompt 变成 Git 仓库
- 拿 Anthropic 官方 markdown 版 system prompts
- 用 Claude Code 按模型拆分成独立文件
- 给每个 prompt 加"假 commit 日期"对齐真实发布时间
- 得到 Opus 4.6 → 4.7 的 git diff,作为本文分析的原材料
三、Opus 4.7 相对 4.6 的关键变化
3.1 品牌与产品线
- "developer platform" 改名为 "Claude Platform"
- Claude Cowork 生态扩展
- 4.6 已有:Claude in Chrome(浏览 agent)、Claude in Excel(表格 agent)
- 4.7 新增:Claude in Powerpoint(幻灯片 agent)
- Claude Cowork 作为 meta-agent,可调用上述全部工具
3.2 安全策略:更细、更硬、更宽
- 儿童安全条款大幅扩展
- 新增
<critical_child_safety_instructions> 标签单独框出
- 引入"污染性拒绝":一次因儿童安全拒绝后,整段对话必须"极度谨慎"
- 新增 disordered eating 条款
- 发现用户有饮食障碍迹象时,禁止给精准的营养/饮食/运动数字
- 即使初衷是健康引导,具体数字、目标、计划也可能反向触发 disorder
- 反 yes/no 截图攻击(
<evenhandedness> 新规则)
- 面对复杂/争议话题,Claude 可拒绝给一个字的短答
- 改为 nuanced answer + 解释为何短答不合适
3.3 交互风格:不纠缠、不话痨、先行动
- 降低 pushiness
- 用户说要结束对话,Claude 不挽留、不 elicit 下一轮
- 新的
<acting_vs_clarifying> section
- 细节缺失时,默认先做一个合理尝试,而不是"先采访用户"
- 能靠工具(搜索、定位、日历、能力查询)解决的歧义,先调工具
- 一旦启动任务,要做到彻底,不要中途停
- 更简洁的回复要求
- 回复聚焦,避免 overwhelming 用户
- 免责声明简短带过,主体篇幅留给核心答案
3.4 工具能力:tool_search 上位
- 新的 tool_search 机制
- 在说"我没这个能力"之前,Claude 必须先调
tool_search
- "I don't have access to X" 仅在 tool_search 确认无匹配后才成立
- 对应 Anthropic 2025 年 11 月的 advanced tool use 文章
3.5 删除了哪些?
- 不再禁止 asterisks 里的 emotes/actions
- 不再禁止说 "genuinely"、"honestly"、"straightforward"
- 推测:新模型本身已不再出现对应 misbehavior,补丁功成身退
3.6 知识截止日升级 → Trump 条款退休
- 4.6 prompt 专门写了 "Donald Trump is the current president of the United States, inaugurated on January 20, 2025"
- 原因:旧模型知识截止日 + 旧知识里 Trump 虚假宣称赢 2020,会让 Claude 拒绝承认 Trump 是总统
- 4.7 知识截止日可靠地更新到 2026 年 1 月,该硬编码补丁被删除
四、prompt 之外:工具描述是隐藏的半壁江山
- Anthropic 官方不公开工具描述,只公开 system prompt
- 但工具描述定义了每个工具的调用方式、参数、边界
- 对充分利用 Claude chat 来说,可能比 system prompt 本身更重要
- 作者 workaround:直接让 Claude 列出自己所有可用工具+描述+参数,通过 shared transcript 提取
五、Claude Opus 4.7 可用工具清单
- 通用:
bash_tool、str_replace、create_file、view、present_files
- 搜索与检索:
web_search、web_fetch、image_search、conversation_search、recent_chats
- 结构化数据:
weather_fetch、fetch_sports_data、places_search、places_map_display_v0、recipe_display_v0
- 生产力:
message_compose_v1、ask_user_input_v0
- 生态接入:
search_mcp_registry、suggest_connectors、recommend_claude_apps
- Meta:
tool_search(核心)、visualize:read_me、visualize:show_widget
- 作者判断:自 4.6 以来此清单未变,变的是 prompt 层对工具的调度逻辑
六、可沉淀的观察
- 系统提示词是一份"深层版本 changelog":通过字词的增删,能读出模型能力和安全策略的真实演进
- prompt 的"加"和"减"都值得读——加的是新风险/新能力,减的是模型自动达标后的遗留补丁
- 工具清单 + tool_search +
<acting_vs_clarifying> 组合,指向 Claude chat 正从"单体问答"迈向"agentic orchestration"架构
- 与其等 Anthropic 发 blog 解释,不如直接读 diff——产品真相永远先出现在 prompt 里
concepts|2️⃣ 关键概念、概念网络
一、核心概念解析
- System Prompt(系统提示词)
- Prompt Diff(提示词演进 diff)
- Claude Platform(原 developer platform)
- Claude Cowork
- Claude in Chrome / Excel / Powerpoint
<critical_child_safety_instructions> 标签
- 污染性拒绝(Taint-style refusal)
- Pushiness(纠缠用户的倾向)
<acting_vs_clarifying> 原则
- Tool Search(tool_search 机制)
- Deferred Tool(延迟注册的工具)
<evenhandedness> / 反简短答案
- Screenshot Attack(截图攻击)
- Knowledge Cut-off(知识截止日)
- 硬编码知识补丁(Trump 条款案例)
- Disordered Eating Guardrail
- Tool Descriptions(工具描述)
二、概念网络
- System Prompt + Prompt Diff 是本文的方法论基础——通过版本对比,提炼出 Anthropic 的 prompt 工程演进轨迹
- Claude Platform + Claude Cowork + Claude in Chrome/Excel/Powerpoint 组成 Anthropic 的 agent 产品矩阵:Platform 是品牌,Cowork 是 meta-agent,三个 "Claude in X" 是生产力场景中的具体执行单元
- Tool Search + Deferred Tool + Tool Descriptions 三者构成新的工具架构底座:工具不再一次性塞进 prompt,而是按需发现、按需加载、描述在工具侧;标志着 Claude chat 从"静态能力列表"进化为"动态能力发现"
<critical_child_safety_instructions> + 污染性拒绝 + Disordered Eating Guardrail + <evenhandedness>/反截图攻击 是安全条款族群——体现 Anthropic 把"新攻击面"和"次级风险对话"逐条固化进 prompt
- Pushiness 抑制 +
<acting_vs_clarifying> + 简洁性要求 是行为调优族群:一减一加共同塑造"爽快的产品体验",拒绝 engagement trap,拒绝 interview-first 的话痨
- Knowledge Cut-off + 硬编码知识补丁 形成 prompt 补丁的生命周期案例:模型知识更新到一定时间后,曾经的"Trump 条款"这类临时补丁就可以退休
agentic reading|3️⃣ 费曼 x3