老板禁止实习生用 Claude 5，说是太危险。。我不听，用它搓了个桌面 APP。她偷偷找我：今天转正！

程序员鱼皮

发布于 2026-06-12 13:34:12

380

文章被收录于专栏：鱼皮客栈鱼皮客栈

大家好，我是程序员鱼皮。

Anthropic 刚刚发布了 Claude Fable 5 神话级模型，AI 编程的跑分直接碾压一众对手，SWE-bench Pro 得分 80.3%，远超 GPT-5.5 的 58.6% 和 Opus 4.8 的 69.2%。

我试着用它来重构了下 Claude Code 泄露的源码，结果完美运行，强到离谱！

但，它也是目前全球最贵的模型，输入输出50 每百万 token，是 Opus 4.8 的两倍，DeepSeek V4 的 50 倍！

既然模型的能力上来了，我曾经的一些想法，也可以开始慢慢实现了，嘿嘿嘿……

记得去年，经常有学编程的小白问我某个软件或者环境怎么安装，我就想着，让 AI 帮我开发一个自动安装软件的网站，还起了个很牛呗的名字「装了吗」。

但当时我跟 AI 对话了好几个小时，最终就搓出来了一堆 Bug，无奈只能饮恨收场。

但如今的 Claude Fable 5 让我的胆子大了不少，这次我不仅要让它帮我实现「装了吗」桌面 APP，还要一次性搞定 Web 管理后台，从 0 到完全可用，看看它能不能 hold 住这种复杂项目。

而且这次我还融合了最近很火的 Loop Engineering 思想。Claude Code 之父 Boris 和 OpenClaw 之父 Peter 都在力推这个概念，核心就是不再一句一句地手动提示 AI，而是设计一套循环机制，让 AI 自主执行、自主验证、自主修复，直到达成目标。

下面就带大家走一遍完整的实战流程，全程在 Cursor 中使用 Claude Fable 5 完成。

一、提示词设计

先简单说一下「装了吗」是干嘛的。

用户输入想安装的软件名称（比如 MySQL、Node.js），系统通过 AI 大模型自动生成一份完整的安装脚本和方案，支持一键执行安装，帮学编程的小白彻底解决装环境的痛苦。

先让 AI 帮我写提示词

我的需求比较零散，如果不把提示词整理清楚，直接丢给 Claude Fable 5 基本就是浪费 tokens。

所以我先通过一个 AI 对话，把零散的想法和草稿素材喂给 Claude Opus 4.6，让它帮我梳理成一段完整的提示词。

我想通过一条提示词，让 Claude Fable 5 + Cursor 帮我自主开发一个「装了吗」桌面 APP，兼容 Mac 和 Windows 系统。同时我要求它通过联网搜索调研 Loop Engineering 的最新理念，在提示词中体现出循环自主的感觉，确保 AI 能自主完成任务。

@需求描述

为了让 AI 开发时能够自主测试 AI 相关的功能，我还需要提前把大模型的 API Key 提供给它。但我不想直接把 Key 写在提示词里，万一泄露就麻烦了。

更好的做法是让 AI 读取本地已有的配置文件，比如我让它读取我 Claude Code 的配置 ~/.claude/settings.json，从里面拿到 API Key 和 Base URL。

提示词讲解

经过几轮对话，AI 帮我生成了一段完整的提示词，结构非常清晰：

下面简单讲解一下这段提示词的结构。

1）角色定义：全栈工程师，擅长 Python + Electron + React 开发。

2）任务描述：开发一个叫「装了吗」的完整系统，帮学编程的同学一键安装软件。

包含三个部分：

Electron 桌面 APP：用户输入想装的软件，选版本和平台，AI 生成安装方案，支持一键安装
Python 服务端：统一调用 AI 生成方案、存储数据、提供 API
Web 管理后台：给管理员管理所有方案和用户反馈

3）技术选型上，桌面端用 Electron 框架。Electron 是用 JavaScript、HTML、CSS 构建跨平台桌面应用的框架，一套代码同时打包 Mac 和 Windows，QQ、VS Code、Notion 这些大家熟悉的 APP 都是用它做的。

4）核心亮点是最后的「自主开发循环」，这里就体现了 Loop Engineering 的思想：

AI 在项目根目录维护 PROGRESS.md，记录当前阶段、已完成事项、进行中事项
每完成一个模块，立即编译运行验证，有报错就修复，通过后再推进下一个
全部功能完成后，以用户视角做一次完整的端到端测试
同一个问题修复超过 5 次仍未解决就跳过，避免死循环

这样 AI 就不会写完代码就停下来等我人工验证，而是会自己跑起来不断循环验证，遇到问题自己修复，直到整个系统能用为止。

二、环境准备

新建一个项目文件夹，在 Cursor 中打开。

接下来准备好几个关键的 AI 扩展：

Context7 MCP：查询最新的技术文档和 API 用法，避免 AI 用过时的写法
Firecrawl MCP：联网搜索能力，让 AI 能获取最新的技术信息
Frontend Design 技能：前端美化技能包，让生成的界面更有设计感

准备就绪，模型选择 Claude Fable 5，开到 High Thinking 档位。记得执行前再检查一遍提示词，毕竟这一个回车下去，上百块钱就没了……

三、AI 自主开发

执行之后，AI 就开始了它的自主循环。

它先读取了我本地的 Claude Code 配置文件，拿到 API Key 和 Base URL，写进了服务端的 .env 文件。

然后开始按顺序开发服务端、桌面端、管理后台。

整个过程我基本没有干预，AI 自己维护着 PROGRESS.md 记录进度，开发完一个模块就自动跑测试，遇到报错就自己修，修完继续推进。它甚至自己打开了桌面 APP 和浏览器，模拟用户操作来做端到端验证。

就是速度有点慢，我一顿饭都吃完了回来，它竟然还在干活。

最终 AI 花了将近 50 分钟，独立完成了整个系统的开发和验证，不需要我中间插手，这就是 Loop Engineering 的威力。

四、成果演示

开发完成后，我让 AI 帮忙启动后端服务器、桌面端程序和 Web 管理页面：

三个服务全部拉起来了，一起看看效果吧~

APP 主界面

打开桌面 APP，有一个大大的 AI 输入框，自动识别出了当前操作系统。整体走的是活泼有趣的风格，口号起的还不错：

预置常见软件

在主界面的「大家都在装」板块，你可以看到非常多主流的环境和依赖，都是我们 AI 编程时经常会用到的，看看有没有眼熟的？

版本选择 + 生成安装方案

比如我要装个 MySQL 数据库，点进去之后，能看到版本号列表和操作系统选择：

选好之后点击「生成安装方案」，因为已有缓存方案，秒出结果。可以看到 AI 生成了一份完整的安装脚本，包含中文注释、环境检测、安装步骤、验证命令。可以直接复制脚本到终端执行安装：

AI 还很贴心地提供了脚本说明，以及安装完成后怎么运行、怎么配置开机自启等等：

一键安装

除了复制脚本安装外，你也可以直接点击「一键安装」按钮，APP 会弹出一个终端窗口执行脚本。

我这里检测出已经安装过 MySQL 了，就不会重复安装：

再让它装个 PostgreSQL 数据库：

同样的操作，这次新安装成功了，体验很不错~

在终端运行 psql 命令验证一下，数据库确实装好了：

AI 推荐能力

这个 APP 不光能选已有的软件，还有 AI 推荐能力。假设我什么都不懂，就在对话框里输入自己遇到的问题，比如：我想更方便地查看 PHP 文件。

AI 就会推荐安装 PHP 环境，可以自由选择版本和操作系统：

然后 AI 快速生成了安装脚本：

点击一键安装，等待一段时间后，也顺利安装成功了：

Web 管理后台

再来看看 Web 管理后台。用默认管理员密码登录后，可以清晰地看到数据统计，包括软件安装排行和版本选择排行：

还能管理所有已经生成的软件安装方案：

点击编辑，可以对有问题的安装脚本进行人工调整，或者让 AI 重新生成：

还可以看到用户的反馈，比如哪些安装有效、哪些无效，方便人工对无效的方案进行调整和优化：

到这里，所有核心功能都能顺利使用了，以后再有人问我怎么装环境，我直接把这个 APP 甩过去就完事了，夯不夯？

五、迭代优化

虽然核心功能是正常的，但是运行过程中，你们有没有发现问题？

我发现了 2 个问题：

1）版本号信息搜索能力不够。比如我要装个 Scala，给出来的版本号列表是错误的。

2）Mac 系统过度依赖 homebrew 这个软件包管理工具。homebrew 源的版本不一定全面，比如 Scala 确实有 3.4.2 版本，但通过 homebrew 来安装会失败。

于是我给 AI 下了一条修复指令，让它自主修复这两个问题并进行测试验证。

自主修复 2 个问题，并进行测试验证。
1）安装软件时，版本号列表获取错误。必须优化信息搜索能力，优先从官方信息源获取版本号列表和安装方式，如果没有官方信息源，才降级为通过联网搜索获取版本号信息，最后才是完全交给 AI 推断版本号。
2）Mac 系统默认使用 homebrew 来安装，但是 homebrew 的版本不一定全面，有时可能会安装失败，你需要优先通过官方获取安装方式，homebrew 作为一种备选方案，且要为 homebrew 安装失败时考虑降级方案。

大概 20 分钟后，AI 完成了修复任务。

对于版本号问题，它设计了一套四级降级链路：

对于 macOS 安装问题，它重写了安装策略：

修复后重启服务，再次测试，安装 Codex 命令行工具。这次给出来的版本号是正确的，跟 npm 官方包的版本对上了：

安装脚本也详细了很多，先走官方 GitHub Release 下载，再降级到 homebrew：

当然，可能还有一些边角 case 没有覆盖到，但目前这个效果已经完全够用了，后续在实际使用中再慢慢打磨就好。

六、费用总结

看到这里，大家肯定很关心费用吧？

打开 Cursor 后台，看看这次烧了多少米：

第一波完整开发花了 27 刀（约 200 元），Bug 修复那一轮花了 14 刀（约 100 元），总共 300 元左右。

你们觉得花这些米做出来这样一套作品，性价比高么？

虽然价格确实不便宜。但换个角度想，AI 一次性搞出了桌面 APP + 服务端 + 管理后台 3 个完整模块，两轮交互就达到了可用状态，如果换成人工开发，这个工作量差不多得 1 个月左右吧？

对了，开发完之后我顺手用 GitHub MCP，让 AI 帮我把整个项目开源到了 GitHub 上。这种简单任务就不需要用 Fable 5 了，随便一个便宜模型就能搞定。

帮我开源整个项目到 GitHub，注意忽略敏感信息的提交

项目已经开源了，感兴趣的同学可以把代码拉下来二次开发，顺手帮我点个 Star 呗~

最后哔哔

回过头来看，为什么 Claude Fable 5 能做到一次性完成可用、两次交互就达到满意效果？

除了模型本身能力确实强之外，还有两个关键因素：

配套的 Harness 驾驭工程，包括我们提前准备的 MCP 工具、前端技能包、API Key 的配置方式，再加上 Cursor 本身自带的 Browser Use 浏览器操作等能力，这些都是在帮 AI 搭好脚手架。
采用了 Loop Engineering 的思想，在提示词里设计了自主开发循环，让 AI 不停下来等我，而是自己跑起来、自己验证、自己修。

我现在理解为什么 Claude Code 之父和 OpenClaw 之父都在力挺 Loop Engineering 了，这种体验真的爽。