从零实现 AI Coding Agent

到 2026 年,对于绝大多数开发来说,应该都离不开 Cursor、Claude Code 或 Codex 这类 Vibe Coding 工具了。

我自己也是 Claude Code 的重度用户,几乎每天都在用,但每次用着它,心里总会有些疑问,或者说好奇心,这玩意儿到底是怎么做到的?

例如它是如何与 LLM 交互的,如何存储短期记忆的,如何调用不同的工具?

去年开始,我决定动手写一个简单的 Coding Agent 来帮助我理解其原理,断断续续花了几个月的时间,写出一个能在终端跑、能读代码改代码跑测试的 Coding Agent,核心代码 3000 行左右。

写完之后发现也不算是很难,只要循序渐进的拆解,按照不同的模块逐个击破,就基本能够自己写一个出来了。

目前网上的教程大多偏理论,所以我把过去这几个月的实现过程,整理成了一个 20 章的实战教程:《从零实现 AI Coding Agent》

教程地址:codepie.roseduan.cn

Coding Agent 的核心

AI Coding Agent 的内核就是:LLM(大脑)+ Tools(手脚)+ Loop(循环)

LLM 负责思考,读懂你说的话、决定下一步干什么、解析报错。

Tools 是它的手脚,读文件、写文件、执行 Bash、搜索代码。

Loop 是节奏,LLM 想一步、调用一个工具、看工具输出、再想下一步,直到任务搞定。

像 Cursor、Claude Code、Codex、Windsurf、Devin 等等这些工具,剥开外壳,骨架基本都是这样的。

真正难的是细节

当然,原理听起来很简单,但是在实现的时候,还是有很多魔鬼细节的,我随便列几个:

  • 流式响应怎么处理?LLM 一边吐 token,中间可能夹一个 tool_use 块,怎么解析?
  • 工具协议怎么实现?JSON Schema 长什么样、tool_result 怎么返回、出错的时候怎么告诉模型?
  • 模型一次返回 5 个工具调用,并行执行还是串行?怎么聚合?
  • 用着用着上下文长到 200k token 了,怎么压缩?哪些消息保留,哪些用摘要替换?
  • LLM 在那一通操作之后,Token 算超了怎么办?怎么提前预警?
  • 用户输入里夹了恶意指令怎么办?Prompt Injection 怎么挡?
  • Bash 命令卡住了,子进程超时怎么办?

这些都不是高大上的算法问题,而是一些工程细节,但你不亲手写一遍,你只是知道"有这么回事",自己亲手写过一遍之后,你脑子里才会有一张 Coding Agent 的解剖图。

课程目录:4 大模块 / 20 章

**模块一|基础:与 LLM 对话(Ch 1-4)**项目搭建、API 调用、流式响应、多轮对话、Tool Use 协议。打通和 LLM 打交道的所有基础设施。

**模块二|工具:文件与命令(Ch 5-8)**Read、Write、Bash、Search 四件套,Agent 之所以能"干活",全靠这些基础工具。

**模块三|引擎:Agent Loop(Ch 9-12)**课程的核心。核心循环、并发工具调用、规划与任务分解、错误处理。把这块写明白,你就真正理解 Agent 是什么。

**模块四|上下文与体验(Ch 13-20)**System Prompt 设计、Token 管理、上下文压缩、CLI 体验、Prompt Injection 防护、项目感知。从"能跑"到"能用"的最后一段。

完整课程目录如下:

课程特点

不依赖任何 Agent 框架。 每一行代码你自己写(延续之前课程的一贯风格),框架接口会变,但底层原理不会,你学的是后者。

TypeScript + Python 双语言。 每一章都有两种语言实现,跟自己熟悉的语言就行。

每章一个可运行 git commit。 clone 下来 checkout 到任何一章,立刻能跑测试验证。

讲的是真实产品的核心技术。 课程里讲的 Agent Loop、Tool Use 协议、上下文压缩、System Prompt 等,就是 Cursor、Claude Code 等工具的核心基础。不是玩具,是你能直接拿去面试讲、拿去工作里改的真东西。

学完你能获得什么

  1. 一个能跑起来的 Coding Agent。装到自己电脑上,给它一个项目,让它读代码、改代码、跑测试,功能上是 Claude Code 的 mini 精简版。
  2. 20 个干净的 git commits。结构清晰、每个 commit 对应一个章节的 git 历史,学完之后这就是你简历里的项目。
  3. 对 Codex / Claude Code 内部的深度理解。下次同事问"这个 Agent 是怎么工作的",你能上白板从原理讲清楚,而不是只会说"我看过 Claude Code 文档"。
  4. AI Infra / Agent 工程方向的简历素材。一个手写的、20 章完整清晰 commits 可查的真实项目,比任何"我用过 XX 框架"都管用。

课程适合谁

  • 每天在用 Cursor / Claude Code / Codex,但说不清它到底怎么工作,想搞懂它内部的工程而不是只会用
  • 试过 LangChain 写 Agent,demo 跑通了,但完全不理解底层的 Tool Use、Loop、上下文管理,框架接口一变就懵
  • 写过几年 Web 后端,想往 AI 方向转,但找不到一个能放进简历、被面试官深挖的真实项目
  • 在校学生,想找一个有深度的毕设 / 课题方向,让导师眼前一亮
  • 准备 AI / Agent 方向求职面试,不想只会复述论文和八股,想能上白板从 Tool Use 协议讲到 Token 管理
  • 已经掌握 TypeScript 或 Python 基础,缺一个能拿出手、能解剖、能讨论的工程实践项目
  • 对 Cursor / Claude Code 内部充满好奇,喜欢"动手做出来"远胜过"读完一篇综述"

免费试看

前 3 章免费,不用登录,可以直接阅读,课程主页如下(或点击文章底部阅读原文):

codepie.roseduan.cn

读完前 3 章可以了解课程的风格、深度、节奏合不合你的胃口,觉得值再往下走。

这个课程不会让你"看完就会",马上成为 AI 大师,但我能保证:

这 20 章一行行写过来,Claude Code 不再是黑盒,Cursor 不再是魔法。下一次你再用它,你眼里看到的是工程、是循环、是 Tool Use 协议,是对一个 AI Agent 设计的基本掌握。

使用 Hugo 构建
主题 StackJimmy 设计