
structure|1️⃣ 三级笔记、思想框架
核心论点:Coding Agent 的能力不只来自模型本身,更来自包裹模型的「harness」系统——工具调用、上下文管理、记忆机制等外围工程,才是让 LLM 在实际编程场景中真正好用的关键。
"A lot of apparent 'model quality' is really context quality." ——这是 coding agent 设计中被低估的「无聊」部分
concepts|2️⃣ 关键概念、概念网络
context:
"When we say harness, we typically mean the software layer around the model that assembles prompts, exposes tools, tracks file state, applies edits, runs commands, manages permissions, caches stable prefixes, stores memory, and many more."
费曼一下:Harness 就是包裹在 LLM 外面的那层「操作系统」。模型只负责 next-token prediction,而 harness 负责一切脏活——组装 prompt、暴露工具、跟踪文件状态、执行命令、管理权限、缓存前缀、存储记忆。Coding harness 是其专为编程任务设计的特化版本。作者的核心观点是:各家 vanilla LLM 能力已经趋同,harness 才是决定产品体验差异的关键变量。
context:
"An agent is a layer on top, which can be understood as a control loop around the model. Typically, given a goal, the agent layer (or harness) decides what to inspect next, which tools to call, how to update its state, and when to stop."
费曼一下:Agent 的本质是一个围绕模型的控制循环:给定目标 → 决定下一步检查什么 → 调用什么工具 → 更新状态 → 判断是否停止。这不是一次性的问答,而是一个持续的「观察-分析-选择-行动」迭代过程。这个循环是 agent 与普通聊天的根本区别。
context:
"The coding agent collects info ('stable facts' as a workspace summary) upfront before doing any work, so that it's not starting from zero, without context, on every prompt."
费曼一下:Agent 在开始工作前,先扫描整个仓库环境——Git 分支、项目文档(AGENTS.md / README)、当前进行中的变更——生成一份 workspace summary。这份「稳定事实」让模型不必每次都从零开始猜测项目上下文。「Fix the tests」不是一条自足的指令,它的正确含义取决于仓库的具体状态。
agentic reading|3️⃣ 费曼 x3