
structure|1️⃣ 三级笔记、思想框架
《一个月 930 万元 token 账单背后的空转风险》
核心观点
文章的中心判断是:Token 已经从技术术语变成 KPI、套餐、捐赠货币和组织里的 AI 使用量度量衡,但真正的问题是“没人说得清它到底在度量什么”。当公司把 AI 的考核标准放在“消耗量”而不是“产出”上,员工就会围绕指标空转,组织也会用不断超支的账单假装自己进入了 AI 时代。
一、Token 的身份跃迁:从技术单位变成 AI 时代的度量衡
1.1 Token 在半年内完成了社会化迁移
- 文章开头列举了一组荒诞场景:三大运营商开始推 Token 套餐,企业内部流行 Tokenmaxxing,00 后校友向母校捐赠 20 亿 Token,Peter Steinberger 一个月烧掉 6030 亿 Token。
- 这些例子共同说明:Token 不再只是模型上下文里的技术单位,而是在组织、营销、教育、慈善和个人生产力叙事中被当作“AI 时代的度量衡”。
- 文章的反讽点在于:Token 的身份快速上升,但它的真实含义并没有被澄清;它看起来像是生产力指标,实际可能只是消耗指标。
1.2 “回报”难量化,“使用量”容易量化
- 作者指出,我们自己买 Token、用公司的 Token、部署一堆 Agent,代码、论文、周报都可以由 Token 烧出来。
- 但另一边,大厂员工因为 Token 消耗排行榜,开始拿公司 Token 处理私事、玩游戏、开发没什么用的子 Agent 来提高排名。
- 关键逻辑是:“回报”这件事很难量化,但“使用量”可以量化;于是所有人都选择了那个容易量化的东西。
- 作者把这称为“管理学的老病”,不是 AI 时代的新问题:当组织不知道如何衡量真实价值时,就会退回到最容易计数的代理指标。
二、用 AI 消灭狗屁工作的公司,正在制造新型狗屁工作
2.1 亚马逊把 Token 消耗变成组织压力
- 据文章转述《金融时报》报道,亚马逊为了逼迫员工拥抱 AI,搞出了“Token 消耗排行榜”,追踪每个员工的用量。
- 公司强制要求超过 80% 的开发者每周完成 AI 使用指标,甚至把消耗 Token 的数量作为考核标准。
- 这个管理动作的悖论在于:原本被寄予厚望、用来消灭“狗屁工作”的 AI,反而成为制造新型“狗屁工作”的源泉。
2.2 MeshClaw 从自动化工具变成刷榜工具
- 亚马逊内部上线了 MeshClaw,一个能发起代码部署、整理邮件、操控 Slack 的 AI Agent。
- 公司内部备忘录把它描述成一种全天候助手:夜间整合白天所学,开会时监控部署,醒来前分类邮件。
- 但在 Token 消耗排行榜的激励下,开发者开始用 MeshClaw 规划旅行、处理私人邮件、分析产品经理在 Slack 上的发言,甚至启动多个子智能体进行吐槽。
- 这不是工具能力的问题,而是激励设计的问题:当排行榜只看消耗量,工具就会被自然改造成刷量机器。
2.3 公司否认 KPI,员工感受到的是实际考核
- 亚马逊回应称 MeshClaw 每天帮助数千名员工自动化重复性工作,公司致力于负责任地部署生成式 AI,Token 统计数据不会用于绩效评估。
- 但员工的说法是:经理在看这个数据;当他们追踪用量时,就会制造扭曲的激励,有些人在这上面很有竞争心。
- 作者把这一点概括为:公司说不算 KPI,但经理偷偷在看。这意味着一个指标即便名义上不是绩效指标,只要进入管理视野,就会塑造员工行为。
2.4 Meta 的排行榜说明这不是单家公司问题
- Meta 也出现过类似情况:一名员工利用内部数据在内网创建仪表盘,让同事们竞争成为公司排名第一的 AI Token 用户。
- 该排行榜汇总了超过 85000 名 Meta 员工的 AI 使用情况,并列出排名前 250 位的超级用户。
- 仪表盘两天后下架,但作者认为它暴露的是“大多数公司的现状”:还没想好 AI 怎么发挥作用,就先裁员;还没想好 Token 怎么用,就把它作为生产力衡量工具。
三、一个月 6000 亿 Token:最贵的问号
3.1 “捐 Token”显示 Token 的价值边界正在被刷新
- 三位 00 后校友向郑州西亚斯学院捐赠 20 亿 Token,网友按 DeepSeek 的价格计算,认为只值 100 元。
- 媒体后来澄清,20 亿 Token 不只是 API 调用量,还包括生成工具使用权和平台积分。
- 但文章强调,“捐 Token”本身已经足够魔幻:捐不起楼,捐算力。Token 的价值和使用边界都在被重新定义。
3.2 OpenClaw 喝水案例展示“成本不重要”后的荒诞用途
- Nat Friedman 讲过一个 OpenClaw 的例子:他随手发出“不惜一切代价确保我补充足够水分”的指令。
- OpenClaw 指示他去厨房喝水,并通过家中摄像头监控他是否真的喝水,最后发来截图确认。
- 原本手机提醒即可完成的事情,现在变成 Token 大量燃烧、调用摄像头、执行监控闭环的 Agent 行动。
- 作者借此追问:当 Token 消耗不再重要、不再需要考虑 Token 的价值和使用边界,我们会拿它来做什么?
3.3 Peter Steinberger 的账单成为“Token 成本不重要”实验
- Peter Steinberger 在 X 上分享 CodexBar 截图,被网友发现三十天用了 6030 亿 Token,累计消耗 130 万美元,约人民币 930 万元。
- 评论区的质疑集中在一个问题:交付了多少代码?消耗的 Token 和最终可用代码之间比例是多少?是否做出了价值百万美元工程师都做不到的东西?
- Peter 回应说,如果关掉 Fast Mode,成本能降 70%;OpenClaw 被 OpenAI 买走后,项目只剩三名成员,他们在 Codex 上运行 100 个实例,自动处理代码提交、Bug 修复、功能更新等问题。
- 但作者继续追问:光看 OpenClaw 的更新,真的需要 130 万美元支撑吗?Peter 说他在探索“如果 Token 成本不重要,软件会怎样被构建”,但 130 万美元花下去后仍没有得到答案。
3.4 6030 亿 Token 烧出的不是答案,而是问题本身
- 作者把这称为“2026 年最贵的一个问号”。
- 这个案例的核心不是 Peter 个人是否浪费,而是即便拥有无比丰沛算力的人,似乎也还不知道这些 Token 可以用来做什么。
- Token 的大规模消耗并没有自动转化为明确的软件构建范式、稳定产出或可复用组织能力。
四、真正的病灶:组织用消耗量替代产出,假装自己看懂了 AI
4.1 GPU 采购压力推动管理者寻找可展示指标
- 大厂高管面对财报上巨额 GPU 采购费,迫切需要向董事会证明这笔钱没白花。
- 但“重构真实业务流”太难、太慢、太需要魄力,于是组织退而求其次,考核“Token 的消耗量”。
- 这让 Token 从工具资源变成财务压力的可视化出口:只要消耗量足够大,就好像公司已经认真拥抱 AI。
4.2 员工被问的是“用了多少”,不是“怎么用才有价值”
- 作者写道,员工一开始甚至没被问过“你觉得 Token 该怎么用”,他们被问的是“你这周用了多少”。
- 这个问题的方向决定了员工的行为:不是寻找真实业务中的高杠杆用法,而是证明自己没有落后于 AI 使用潮流。
- 当管理问题从“产出什么”变成“消耗多少”,组织就会制造出围绕消耗量展开的新工作。
4.3 当工具按消耗量考核,它就变成燃料
- 文章最关键的判断是:当一个工具的考核标准是“消耗量”而不是“产出”,它就不再是工具了。
- 它变成燃料,唯一使命就是被烧掉;至于烧完之后驱动了什么,没有人真的在意。
- 这也是“空转风险”的核心:Token 在账单、排行榜、仪表盘里高速流动,却未必带来判断、产品、代码质量或组织能力的增加。
五、结尾判断:真实的是账单,虚的是规则共识
5.1 所有人都在假装看懂了规则
- 作者把当下的 AI Token 热潮总结为“一场所有人都假装看懂了规则的游戏”。
- 公司假装知道怎么用,员工假装在认真用,投资人假装看到了回报。
- 在这个游戏里,唯一真实的东西是不断超支的账单。
5.2 Token 终会找到真正用途,但在那之前要追问必要性
- 文章并不否认 Token 最终可能成为真正的“新质生产力”。
- 它反对的是在真正用途尚未清晰之前,把动辄上亿 Token 的消耗包装成生产力本身。
- 最后的问题是:在烧掉巨量 Token 之前,是否真的有必要?这个问题要求组织重新区分 AI 使用量、真实产出和管理幻觉。
关键概念/术语
- Token:文章中的 AI 时代“度量衡”,但问题在于它的度量对象并不清楚。
- Tokenmaxxing:为了最大化 Token 消耗而使用 AI 的刷量战术,是排行榜激励下的扭曲行为。
- Token 消耗排行榜:把 AI 使用量转化为组织竞争和管理压力的指标工具。
- MeshClaw:亚马逊内部 AI Agent,原本用于自动化工作,在文中成为刷 Token 排行榜的典型工具。
- OpenClaw:文中用于展示“Token 成本不重要”后用途边界变形的 Agent 案例。
- 狗屁工作:AI 原本要消灭的重复性、低价值工作;但错误激励会制造新的狗屁工作。
- 6030 亿 Token / 130 万美元账单:Peter Steinberger 案例中的极端消耗量,是文章讨论空转风险的核心案例。
- Fast Mode:Peter 回应中提到的高成本模式;关掉后成本可降 70%。
- 新质生产力:文章结尾承认 Token 未来可能找到真正用途,但强调现在不能把消耗本身等同于生产力。
concepts|2️⃣ 关键概念、概念网络
概念解析辞典
针对 《一个月 930 万元 token 账单背后的空转风险》(爱范儿)的概念提取
一、核心概念解析(Core Concepts)
1. Token
- context:
- 费曼一下:在本文里,Token 不是单纯的模型输入输出单位,而是被组织和市场误当成 AI 时代通用价值单位的“计数对象”。问题是,它能计数消耗,却不能自动证明价值。
2. AI 时代的「度量衡」
- context:
- 费曼一下:度量衡本来应该让大家对价值形成共识,但这里的 Token 只让大家对“用了多少”形成共识,至于衡量的是生产力、浪费还是表演,仍然不清楚。
3. Tokenmaxxing
- context:
- 费曼一下:Tokenmaxxing 是把“用 AI”变成“烧 Token”的刷量策略。它不是为了更好地完成工作,而是为了在组织指标里显得更像 AI 时代的先进员工。
4. Token 消耗排行榜
- context:
- 费曼一下:排行榜把 AI 使用变成可比较、可竞争、可被经理观看的数字。它看似推动采用,实际会把员工注意力从真实产出拉向排名表演。
5. 「回报」与「使用量」的错位
- context:
- 费曼一下:这是全文的管理学底层矛盾。组织真正想要的是回报,但回报难算,于是用使用量代替;一旦代替发生,员工优化的就不再是回报,而是使用量。
6. 新型「狗屁工作」
- context:
- 费曼一下:AI 本来被部署来消灭重复、低价值、形式主义的工作;但如果考核方式错误,它会制造一批专门围绕 AI 使用指标展开的新形式主义。
7. MeshClaw
- context:
- 费曼一下:MeshClaw 是文章中的组织工具变形案例。它原本能自动化部署、邮件和 Slack,但在排行榜环境下,能力越强,越容易被挪用为刷 Token 的机器。
8. 扭曲的激励
agentic reading|3️⃣ 费曼 x3