《Agentic Engineering 综述：从概念到实践》

CleanShot 2026-03-24 at 08.44.01@2x.png

structure｜1️⃣ 三级笔记、思想框架

本文是 howie 用 Claude Opus 基于 Readwise Inbox 中 60+ 篇 agentic engineering 素材生成的全景综述，系统梳理了 Agentic Engineering 的定义、演化、核心模式、多智能体架构、工具生态、安全挑战与未来方向。

Simon Willison（2026.3）：agentic engineering 是借助 coding agents 来开发软件的实践
- coding agents 的本质：「能写代码并执行代码的 agent」——Claude Code、Codex、Gemini CLI
- Agent 的锚定定义：Agent 在循环中运行工具以达成目标（Agents run tools in a loop to achieve a goal）
- 代码执行（code execution）是关键能力——没有执行能力，LLM 输出只是文本
Andrej Karpathy 最早提出这个术语：凌晨 3 点之后的编码才叫 vibe coding，白天认真的工作叫 agentic engineering
- vibe coding = 不关心代码本身的 LLM 编程
- agentic engineering = 你对代码质量负责
吴恩达的角度：Agentic 是形容词而非二元分类，描述系统在自主性上的不同程度
- 核心洞察：将复杂任务拆解为多步骤、逐步推进、每步优化的方式（agentic workflow），显著优于一次性端到端输出

2024 底 → 2025 初：Anthropic 发表 Building Effective Agents，确立 workflow 与 agent 的架构区分
- workflow = 预定义代码路径编排 LLM
- agent = LLM 动态掌控自身流程和工具使用
- Andrew Ng 提出四大 agentic 设计模式：反射、工具使用、规划、多智能体协作
2025.2：Claude Code 悄然发布
- Karpathy 称之为「LLM Agent 看起来像什么的第一次令人信服的示范」
2025 年中：Context Engineering 概念爆发
- Shopify CEO Tobi Lutke：「为任务提供所有上下文使其对 LLM 来说可合理解决的艺术」
- Karpathy 力挺其取代 prompt engineering
- LangChain：构建动态系统，在正确时机、以正确格式，提供正确信息和工具
2025 下半年：各家 CLI coding agent 全面铺开（Claude Code、Codex CLI、Gemini CLI…）
- Agent Skills 作为开放标准发布
- agents.md 标准化推进
2025 底 → 2026 初：多 agent 并行成为现实
- Anthropic 用 16 个并行 agent 从零构建了能编译 Linux 的 C 编译器
- Cursor 用数百个并发 agent 重写了自己的代码库

长上下文失败的四种模式（Drew Breunig）：
- 上下文中毒（Context Poisoning）
- 上下文分心（Context Distraction）
- 上下文混淆（Context Confusion）
- 上下文冲突（Context Clash）
应对方案：工具装载（限制活跃工具数量）、上下文隔离（子 agent 独立上下文）、compaction（压缩后加密 token 传递）
两个层次（bassimeledath）：context engineering 优化当前会话；harness engineering 构建整个环境、工具和反馈循环

Claude Code 为何出色：系统提示 ~2800 token，工具描述高达 9400 token；拒绝 RAG，用 ripgrep/jq/find 搜索；CLAUDE.md 是性能分水岭；本质 = LLM + 系统提示 + 工具在循环中运行
Skills 标准：SKILL.md 指令 + 可执行脚本 + 参考资源；bash + 文件系统就是我们所需的一切
**agents.md vs CLAUDE.md**：OpenAI 推 agents.md 作为跨工具标准（6 万+ 开源项目采用）；Anthropic 坚持 CLAUDE.md，但提供 @AGENTS.md 引用机制

单 Agent vs 多 Agent：Anthropic 承认目前没有定论
上下文工程 vs 模型能力：GitClear 分析 2.11 亿行代码，AI 工具使代码量增 10% 但质量下降 60%——瓶颈是没有人工程化管理模型看到什么
技术债务：Forrester 预测 75% 技术负责人在 2026 底面临严重 AI 代码技术债；Willison：不要提交你自己没审查过的 PR
Agentic 一词泛滥：MIT Tech Review 吐槽——想卖东西？叫它 agentic 就行了

concepts｜2️⃣ 关键概念、概念网络

agentic reading｜3️⃣ 费曼 x3