image.png

structure|1️⃣ 三级笔记、思想框架

🗺️ 文章全景

Sebastian Raschka 的 2025 年度 LLM 综述,系统回顾了这一年大语言模型领域最重要的进展,涵盖训练范式、架构演进、推理扩展、工具使用、评测困境、AI 与人类工作的关系,以及对 2026 年的预测。核心主线:2025 年是推理模型之年,RLVR + GRPO 成为 LLM 后训练的主导范式,推理时扩展与工具使用成为新的进步杠杆。


1. 推理之年:RLVR 与 GRPO 的崛起

1.1 DeepSeek 时刻

1.2 LLM 发展焦点年表

1.3 RLVR 的下一步


2. GRPO:年度学术宠儿


3. LLM 架构:分叉路口


4. 推理时扩展与工具使用


5. 年度关键词:Benchmaxxing


6. AI 与编程、写作、研究


7. 竞争优势:私有数据


8. From Scratch 系列


9. 2025 惊喜与 2026 预测

9.1 七大惊喜

  1. 多个推理模型在数学竞赛中达到金牌水平(比预期提前一年)
  2. Llama 4 失宠,Qwen 超越 Llama
  3. Mistral AI 采用 DeepSeek V3 架构
  4. 新竞争者崛起:Kimi、GLM、MiniMax、Yi
  5. 高效混合架构被头部实验室采纳
  6. OpenAI 发布开源模型 gpt-oss
  7. MCP 成为 Agent 系统的事实标准(比预期更快)

9.2 四大预测

  1. 消费级文本扩散模型将面世

concepts|2️⃣ 关键概念、概念网络

agentic reading|3️⃣ 费曼 x3