AI 编程 Agent 越来越强。
现在我们已经不只是让模型补全一段代码,而是直接让 Claude Code、Codex、OpenCode 这类工具读项目、写文件、调用命令、修改代码、完成一整个开发任务。
但随之而来的问题是:Agent 的执行过程越来越像黑箱。
我们通常只能看到最后结果,却不容易知道:
为了把这个过程看清楚,我用一个很小的 demo 做了一次实验:让 Claude Code 从零生成一个贪吃蛇小游戏,同时用 ccglass 记录整个请求过程。
ccglass 项目地址:
https://github.com/jianshuo/ccglass
补充说明:这次演示里,我使用的是第三方模型 API,上游是阿里云 DashScope 的 Anthropic 兼容接口,并不是直连 Anthropic 官方 API。ccglass 在本地作为代理接入 Claude Code,记录本地代理收到的请求,再转发到配置好的上游服务。因此,截图里可以看到 Claude Code、Anthropic 兼容协议和阿里云上游一起出现。
这次任务很简单:让 Claude Code 在 demo-snake 目录里从零创建一个可以直接打开的贪吃蛇小游戏。
我给 Claude 的要求是:
请在当前目录 demo-snake 里从零创建一个可以直接打开的贪吃蛇小游戏。
要求:
1. 使用纯 HTML/CSS/JavaScript,不依赖外部框架。
2. 生成 index.html、style.css、game.js 三个文件。
3. 支持方向键控制。
4. 显示当前分数和最高分。
5. 撞墙或撞到自己后游戏结束。
6. 支持点击按钮重新开始。
7. 页面风格做得稍微精致一点,适合截图展示。
8. 完成后告诉我如何在浏览器打开测试。
这次 demo 的记录重点不是游戏本身,而是 Claude 生成这个游戏时,ccglass 看到什么。先启动 ccglass,选择 Claude Code,然后在 Claude 里输入这段任务。

从终端可以看到,ccglass 读取到 Claude Code 配置中的上游地址,并将请求转到本地代理。这里的上游是:
https://dashscope.aliyuncs.com/apps/anthropic也就是说,这次 demo 的调用链路大致是:
Claude Code -> ccglass 本地代理 -> 阿里云 DashScope Anthropic 兼容接口 -> 模型这里的重点不是“Claude 能不能写一个小游戏”。这个任务足够简单,很多 AI 工具都能完成。
真正值得看的,是它在生成这个游戏时,背后发给模型的请求到底长什么样。
ccglass 是一个面向 AI 编程 Agent 的本地观测工具。它通过“本地代理 + Web Dashboard”的方式,记录 Claude Code、Codex、DeepSeek、Kimi、OpenCode 等工具实际发给模型 API 的请求和响应。
启动后,ccglass 会把 Claude Code 的请求转到本地代理,再转发给真实上游。这样我们就能在 Dashboard 里看到请求内容。
在这次 demo 中,ccglass 记录到了多轮请求。左侧可以看到每一轮请求的模型、耗时、消息数量、工具数量和 HTTP 状态。

这张图里有几个信息很关键:
Write 工具调用,准备写入文件。这就把“Agent 在背后做了什么”从猜测变成了可观察事实。
很多人以为 AI Agent 发给模型的内容就是“用户输入的那句话”。
但实际请求远比这复杂。
在 ccglass 的 messages 视图里,可以看到这次请求包含了系统提醒、当前日期、用户任务,以及后续的 assistant 内容。

可以看到,Claude 收到的不只是“写一个贪吃蛇游戏”。
请求里还会包含类似这样的上下文:
这也是为什么 AI Agent 有时候表现得像“知道很多现场信息”:它不是凭空知道的,而是这些上下文被组织进了模型请求。
对于开发者来说,这一点非常重要。
如果 Agent 跑偏了,我们不能只看最后回复,而应该回到请求里检查:模型到底看到了什么?它是不是缺了关键上下文?是不是带了太多无关信息?是不是工具结果影响了下一轮判断?
ccglass 的价值就在这里。
AI 编程 Agent 和普通聊天机器人最大的区别之一,是它可以调用工具。
比如读文件、写文件、运行命令、搜索代码、启动子任务等。
但模型能不能正确使用工具,很大程度取决于工具 schema 和描述写得怎么样。
在 ccglass 的 tools 视图里,可以看到 Claude Code 暴露给模型的工具定义。

这张图展示的是工具定义,而不是最终工具调用结果。
它告诉我们:模型在这一轮请求里能看到哪些工具、这些工具什么时候该用、参数 schema 是什么。
比如 Agent 工具的描述里会说明:
同理,Claude Code 还会向模型提供写文件、读文件、运行命令等工具。模型根据这些工具描述,决定下一步如何行动。
这对调试 Agent 很有帮助。
如果某个工具经常被误用,问题可能不在模型本身,而在工具说明、参数设计或上下文组织方式上。
这次 demo 的任务是生成三个文件:
index.htmlstyle.cssgame.jsClaude 在分析任务后,开始把用户需求转成实际文件。
在 ccglass 的记录里,可以看到 Claude 的 response 和后续状态。最后它总结已经创建了三个文件,并提示下一步在浏览器中打开 index.html 测试。

这张图里还有一个很有价值的信息:usage。
它展示了这次请求的 token 使用情况,包括:
input_tokensoutput_tokens在截图里可以看到,ccglass 记录到了输入、输出和 cache 相关 token。对于长任务、多轮对话和团队使用场景,这类信息非常有用。
因为 AI Agent 的成本经常不是一次请求决定的,而是由多轮上下文、工具结果和缓存机制共同决定。
如果你发现一次任务 token 消耗异常,就可以用 ccglass 往回看:
这比只看最终账单要具体得多。
Claude 最终在 demo-snake 目录里生成了三个文件:
demo-snake/
├── index.html
├── style.css
└── game.js浏览器打开 index.html 后,可以看到一个完整的贪吃蛇小游戏。
它支持:
localStorage 保存最高分。
这个小游戏本身不是重点。
重点是:我们不只是看到了“Claude 最后生成了什么”,还通过 ccglass 看到了它生成过程中的请求、上下文、工具定义、响应和 token 使用。
这就是 AI Agent 可观测性的意义。
通过这次小实验,可以看到 AI 编程 Agent 的一次任务其实包含很多层内容。
第一,用户输入只是请求的一部分。
模型实际看到的内容还包括 system prompt、system reminder、当前环境、可用工具、历史消息和工具结果。
第二,工具定义会影响 Agent 行为。
模型能不能正确读文件、写文件、运行命令,取决于它在请求里看到的工具 schema 和描述。
第三,多轮上下文会影响下一步动作。
Agent 每一次工具调用后的结果,都可能进入下一轮请求,继续影响模型判断。
第四,token 和 cache 需要被观测。
AI Agent 一旦进入多轮任务,token 消耗可能很快增长。如果没有工具观测,就很难知道成本花在哪里。
第五,调试 Agent 不能只看最终答案。
当 Agent 误判、漏看文件、调用错工具或上下文膨胀时,真正的问题往往藏在请求内容里。
ccglass 尤其适合这些用户:
它不是另一个 AI 编程助手,而是给 AI 编程助手配的一层“观测玻璃”。
ccglass 是开源项目,可以通过 npm 安装:
npm install -g ccglass安装后直接运行:
ccglass然后选择要观察的工具,例如 Claude Code、Codex、DeepSeek、Kimi、OpenCode 等。
也可以直接指定:
ccglass claude
ccglass codex
ccglass deepseek
ccglass kimi
ccglass opencode启动成功后,终端会显示 Dashboard 地址:
dashboard: http://127.0.0.1:PORT打开这个地址,就可以实时查看请求流。
GitHub:
https://github.com/jianshuo/ccglass
npm 安装:
npm install -g ccglass如果你正在使用 Claude Code、Codex、OpenCode、DeepSeek、Kimi 或其他 AI Agent,并且想知道它们到底把什么发给了模型,ccglass 值得试试。
AI Agent 越强,可观测性就越重要。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。