前几天发了一篇
7*24小时全栈开发的性价比黑奴:Qwen3.5-plus + Agent Team
今天补充一些避坑指南和下一步进阶方向 首先是,搭配食用的7 条避坑指南,可以直接扔给 AI 形成记忆:1. 拒绝“假通”测试:严禁仅用 curl 测试 API。必须通过 MCP 或 browser-use 调用真实浏览器进行端到端点击测试,防止后端数据通了但前端样式丢失或交互失效。2. 原生视觉走查:截图后禁止让 AI 写 Python 脚本读图。直接调用AI的原生视觉能力“看”截图,让它像真实用户一样判断 UI 布局错位或渲染失败。3. 带状态调试:放弃 Playwright 默认的无痕沙盒模式。使用 browser-use --browser real --profile "Default" 挂载本地真实 Chrome 配置(含 Cookie/Session),解决因验证码或登录态丢失导致 AI 无法进入业务页面的死结。4. Git 存档回滚:将 Git Commit 设为“游戏存档点”。在自动化脚本中集成错误检测,一旦 AI 陷入死循环或测试连续失败,自动执行 git reset --hard 回滚至上一个稳定版本,切断错误累积。5. 原子化任务粒度:task.json 的拆解必须极细。拒绝“完成支付功能”这种模糊指令,必须拆解为“定义数据库表”、“写后端接口”、“写前端组件”、“联调”四个独立任务。6. 上下文“无状态”化:不要依赖长对话记忆。每次循环强制重置 Context,迫使 AI 必须通过读取 progress.txt 和文件系统来获取状态,这是保持模型长时间运行不“降智”的关键。7. 文件权限隔离:在 Agent Team 中实施严格的目录级权限控制。Backend Agent 只能写 /api,Frontend Agent 只能写 /src,防止 AI 幻觉导致跨层级乱改代码引发灾难。 接下来的3 个升级方向,让Agent越来越好用:1. RAG 动态知识库:为 Agent 挂载向量数据库,索引 Next.js 15、Supabase 等最新官方文档。防止模型因训练数据滞后而写出过时语法(幻觉),实现“边查文档边写代码”。2. 成本熔断机制:在循环脚本中集成 Token 计费监控。设定阈值(如单任务耗资 >$2 或重试 >5 次),触发时自动 Kill 进程并推送到手机,防止逻辑死循环导致 API 账单爆炸。3. Human-in-the-Loop 网关:在 task.json 引入 requires_approval 字段。对于数据库 Schema 变更、生产环境部署等高危操作,Agent 必须挂起并发送通知,等待人类回复“Approve”后方可执行。怎么才能让AI持续工作?这块还有什么经验,欢迎评论交流