从零实现 AI Coding Agent

到 2026 年，对于绝大多数开发来说，应该都离不开 Cursor、Claude Code 或 Codex 这类 Vibe Coding 工具了。

我自己也是 Claude Code 的重度用户，几乎每天都在用，但每次用着它，心里总会有些疑问，或者说好奇心，这玩意儿到底是怎么做到的？

例如它是如何与 LLM 交互的，如何存储短期记忆的，如何调用不同的工具？

去年开始，我决定动手写一个简单的 Coding Agent 来帮助我理解其原理，断断续续花了几个月的时间，写出一个能在终端跑、能读代码改代码跑测试的 Coding Agent，核心代码 3000 行左右。

写完之后发现也不算是很难，只要循序渐进的拆解，按照不同的模块逐个击破，就基本能够自己写一个出来了。

目前网上的教程大多偏理论，所以我把过去这几个月的实现过程，整理成了一个 20 章的实战教程：《从零实现 AI Coding Agent》。

教程地址：codepie.roseduan.cn

Coding Agent 的核心

AI Coding Agent 的内核就是：LLM（大脑）+ Tools（手脚）+ Loop（循环）。

LLM 负责思考，读懂你说的话、决定下一步干什么、解析报错。

Tools 是它的手脚，读文件、写文件、执行 Bash、搜索代码。

Loop 是节奏，LLM 想一步、调用一个工具、看工具输出、再想下一步，直到任务搞定。

像 Cursor、Claude Code、Codex、Windsurf、Devin 等等这些工具，剥开外壳，骨架基本都是这样的。

当然，原理听起来很简单，但是在实现的时候，还是有很多魔鬼细节的，我随便列几个：

这些都不是高大上的算法问题，而是一些工程细节，但你不亲手写一遍，你只是知道"有这么回事"，自己亲手写过一遍之后，你脑子里才会有一张 Coding Agent 的解剖图。

**模块一｜基础：与 LLM 对话（Ch 1-4）**项目搭建、API 调用、流式响应、多轮对话、Tool Use 协议。打通和 LLM 打交道的所有基础设施。

**模块二｜工具：文件与命令（Ch 5-8）**Read、Write、Bash、Search 四件套，Agent 之所以能"干活"，全靠这些基础工具。

**模块三｜引擎：Agent Loop（Ch 9-12）**课程的核心。核心循环、并发工具调用、规划与任务分解、错误处理。把这块写明白，你就真正理解 Agent 是什么。

**模块四｜上下文与体验（Ch 13-20）**System Prompt 设计、Token 管理、上下文压缩、CLI 体验、Prompt Injection 防护、项目感知。从"能跑"到"能用"的最后一段。

完整课程目录如下：

不依赖任何 Agent 框架。 每一行代码你自己写（延续之前课程的一贯风格），框架接口会变，但底层原理不会，你学的是后者。

TypeScript + Python 双语言。 每一章都有两种语言实现，跟自己熟悉的语言就行。

每章一个可运行 git commit。 clone 下来 checkout 到任何一章，立刻能跑测试验证。

讲的是真实产品的核心技术。 课程里讲的 Agent Loop、Tool Use 协议、上下文压缩、System Prompt 等，就是 Cursor、Claude Code 等工具的核心基础。不是玩具，是你能直接拿去面试讲、拿去工作里改的真东西。

一个能跑起来的 Coding Agent。装到自己电脑上，给它一个项目，让它读代码、改代码、跑测试，功能上是 Claude Code 的 mini 精简版。
20 个干净的 git commits。结构清晰、每个 commit 对应一个章节的 git 历史，学完之后这就是你简历里的项目。
对 Codex / Claude Code 内部的深度理解。下次同事问"这个 Agent 是怎么工作的"，你能上白板从原理讲清楚，而不是只会说"我看过 Claude Code 文档"。
AI Infra / Agent 工程方向的简历素材。一个手写的、20 章完整清晰 commits 可查的真实项目，比任何"我用过 XX 框架"都管用。

前 3 章免费，不用登录，可以直接阅读，课程主页如下（或点击文章底部阅读原文）：

codepie.roseduan.cn

读完前 3 章可以了解课程的风格、深度、节奏合不合你的胃口，觉得值再往下走。

这个课程不会让你"看完就会"，马上成为 AI 大师，但我能保证：

这 20 章一行行写过来，Claude Code 不再是黑盒，Cursor 不再是魔法。下一次你再用它，你眼里看到的是工程、是循环、是 Tool Use 协议，是对一个 AI Agent 设计的基本掌握。