引言

Agentic Engineering：解构 Claude Code 的智能体架构

最有用的 AI 系统不仅仅是回答问题——它们会采取行动。本书教你如何构建它们。

什么是智能体系统（Agentic System）？

智能体系统是一种能够自主规划并执行操作以达成目标的软件。与传统的单次响应式对话不同，Agent 可以跨步骤执行命令、编辑代码、调用 API 并根据反馈做出决策。它感知环境，推理下一步行动，执行操作并观察结果，通过不断的迭代直到任务达成。

构建这类系统与开发传统的 LLM 应用有着本质区别。真正的挑战往往不在于提示词的微调或模型选择，而在于如何设计控制流、处理边界错误、定义权限边界、管理上下文限制，以及建立用户信任。如何确保 AI 在修改代码时不破坏现有服务？工具调用失败时如何自动恢复？如何在数万 Token 的对话中精准压缩核心上下文？这些都是需要通过严谨工程手段解决的难题。

为什么选择 Claude Code 作为案例？

市面上的大多数 Agent 教程还停留在演示阶段：天气查询、SQL 生成或简单的订餐脚本。而本书选择了另一条路：深度剖析 Claude Code——一个每天被开发者实际使用的生产级编程智能体。

它支撑着 40 多个工具的协作，管理着大规模的文件操作，拥有一套严密的权限过滤机制，且能在极严苛的 Token 预算下保持任务的连续性，同时还要兼顾终端 UI 的即时交互。Claude Code 不是实验室里的原型，而是在真实生产环境的严苛约束下锤炼而成的成熟产品。本书中的设计模式正是源自这些真实的生产约束。

核心内容概览

我们将 Claude Code 的复杂架构提炼为 10 个章节，覆盖智能体系统的核心模式：

Agent 循环 —— 驱动自主行为的核心控制闭环。
提示架构 —— 构建具备高可靠性与可控性的系统级提示词。
工具设计 —— 打造安全、易用且具备强容错能力的原子功能组件。
权限系统 —— 在保障安全的前提下，如何授予 Agent 执行权。
错误处理 —— 针对工具失效、模型幻觉及上下文崩溃的防御性编程。
上下文管理 —— 长对话场景下的 Token 压缩与信息留存策略。
状态管理 —— 维持对话连贯性、工具结果追踪与用户偏好。
子智能体架构 —— 如何通过层级化结构拆解并执行复杂任务。
可扩展性 —— 后端插件系统与第三方生态的集成方案。
流式体验 —— 为长耗时异步任务构建极佳的响应式交互界面。

本书的适用范围

这并非一本 Claude Code 的产品说明书——我们提炼的是模式，而非具体细节。你在这里学到的不是如何配置 Claude Code，而是如何借鉴经过生产验证的原则来架构你自己的智能体系统。

本书侧重于架构原理而非单纯的代码临摹。无论你的底层模型是 Claude、GPT-4 还是开源 LLM，这些架构模式都是通用的。本书为开发者编写，而非研究人员，我们崇尚务实的解决方案。

章节结构

全书逻辑分为五个阶段：

第一部分：基石 (第 1-3 章) —— 核心循环、提示词工程与工具化。
第二部分：管控 (第 4-5 章) —— 权限治理与容错机制。
第三部分：规模化 (第 6-7 章) —— 解决上下文与状态维持。
第四部分：协同 (第 8-9 章) —— 分治策略与插件生态。
第五部分：交付 (第 10 章) —— 优化流式交互体验。

尽管建议按顺序阅读以建立完整的知识体系，但各章节也具备独立参考价值，你可以翻阅到感兴趣的部分直接开始。

第一章从每个智能体都需要的核心结构开始：循环。