
大家好,我是程序员鱼皮。
Anthropic 刚刚发布了 Claude Fable 5 神话级模型,AI 编程的跑分直接碾压一众对手,SWE-bench Pro 得分 80.3%,远超 GPT-5.5 的 58.6% 和 Opus 4.8 的 69.2%。
我试着用它来重构了下 Claude Code 泄露的源码,结果完美运行,强到离谱!

但,它也是目前全球最贵的模型,输入 输出50 每百万 token,是 Opus 4.8 的两倍,DeepSeek V4 的 50 倍!

既然模型的能力上来了,我曾经的一些想法,也可以开始慢慢实现了,嘿嘿嘿……
记得去年,经常有学编程的小白问我某个软件或者环境怎么安装,我就想着,让 AI 帮我开发一个自动安装软件的网站,还起了个很牛呗的名字「装了吗」。
但当时我跟 AI 对话了好几个小时,最终就搓出来了一堆 Bug,无奈只能饮恨收场。
但如今的 Claude Fable 5 让我的胆子大了不少,这次我不仅要让它帮我实现「装了吗」桌面 APP,还要一次性搞定 Web 管理后台,从 0 到完全可用,看看它能不能 hold 住这种复杂项目。
而且这次我还融合了最近很火的 Loop Engineering 思想。Claude Code 之父 Boris 和 OpenClaw 之父 Peter 都在力推这个概念,核心就是不再一句一句地手动提示 AI,而是设计一套循环机制,让 AI 自主执行、自主验证、自主修复,直到达成目标。

下面就带大家走一遍完整的实战流程,全程在 Cursor 中使用 Claude Fable 5 完成。
先简单说一下「装了吗」是干嘛的。
用户输入想安装的软件名称(比如 MySQL、Node.js),系统通过 AI 大模型自动生成一份完整的安装脚本和方案,支持一键执行安装,帮学编程的小白彻底解决装环境的痛苦。
我的需求比较零散,如果不把提示词整理清楚,直接丢给 Claude Fable 5 基本就是浪费 tokens。
所以我先通过一个 AI 对话,把零散的想法和草稿素材喂给 Claude Opus 4.6,让它帮我梳理成一段完整的提示词。
我想通过一条提示词,让 Claude Fable 5 + Cursor 帮我自主开发一个「装了吗」桌面 APP,兼容 Mac 和 Windows 系统。同时我要求它通过联网搜索调研 Loop Engineering 的最新理念,在提示词中体现出循环自主的感觉,确保 AI 能自主完成任务。
@需求描述

为了让 AI 开发时能够自主测试 AI 相关的功能,我还需要提前把大模型的 API Key 提供给它。但我不想直接把 Key 写在提示词里,万一泄露就麻烦了。
更好的做法是让 AI 读取本地已有的配置文件,比如我让它读取我 Claude Code 的配置 ~/.claude/settings.json,从里面拿到 API Key 和 Base URL。
经过几轮对话,AI 帮我生成了一段完整的提示词,结构非常清晰:

下面简单讲解一下这段提示词的结构。
1)角色定义:全栈工程师,擅长 Python + Electron + React 开发。
2)任务描述:开发一个叫「装了吗」的完整系统,帮学编程的同学一键安装软件。
包含三个部分:
3)技术选型上,桌面端用 Electron 框架。Electron 是用 JavaScript、HTML、CSS 构建跨平台桌面应用的框架,一套代码同时打包 Mac 和 Windows,QQ、VS Code、Notion 这些大家熟悉的 APP 都是用它做的。
4)核心亮点是最后的「自主开发循环」,这里就体现了 Loop Engineering 的思想:
这样 AI 就不会写完代码就停下来等我人工验证,而是会自己跑起来不断循环验证,遇到问题自己修复,直到整个系统能用为止。
新建一个项目文件夹,在 Cursor 中打开。
接下来准备好几个关键的 AI 扩展:

准备就绪,模型选择 Claude Fable 5,开到 High Thinking 档位。记得执行前再检查一遍提示词,毕竟这一个回车下去,上百块钱就没了……

执行之后,AI 就开始了它的自主循环。
它先读取了我本地的 Claude Code 配置文件,拿到 API Key 和 Base URL,写进了服务端的 .env 文件。

然后开始按顺序开发服务端、桌面端、管理后台。
整个过程我基本没有干预,AI 自己维护着 PROGRESS.md 记录进度,开发完一个模块就自动跑测试,遇到报错就自己修,修完继续推进。它甚至自己打开了桌面 APP 和浏览器,模拟用户操作来做端到端验证。

就是速度有点慢,我一顿饭都吃完了回来,它竟然还在干活。
最终 AI 花了将近 50 分钟,独立完成了整个系统的开发和验证,不需要我中间插手,这就是 Loop Engineering 的威力。
开发完成后,我让 AI 帮忙启动后端服务器、桌面端程序和 Web 管理页面:

三个服务全部拉起来了,一起看看效果吧~
打开桌面 APP,有一个大大的 AI 输入框,自动识别出了当前操作系统。整体走的是活泼有趣的风格,口号起的还不错:

在主界面的「大家都在装」板块,你可以看到非常多主流的环境和依赖,都是我们 AI 编程时经常会用到的,看看有没有眼熟的?

比如我要装个 MySQL 数据库,点进去之后,能看到版本号列表和操作系统选择:

选好之后点击「生成安装方案」,因为已有缓存方案,秒出结果。可以看到 AI 生成了一份完整的安装脚本,包含中文注释、环境检测、安装步骤、验证命令。可以直接复制脚本到终端执行安装:

AI 还很贴心地提供了脚本说明,以及安装完成后怎么运行、怎么配置开机自启等等:

除了复制脚本安装外,你也可以直接点击「一键安装」按钮,APP 会弹出一个终端窗口执行脚本。
我这里检测出已经安装过 MySQL 了,就不会重复安装:

再让它装个 PostgreSQL 数据库:

同样的操作,这次新安装成功了,体验很不错~

在终端运行 psql 命令验证一下,数据库确实装好了:

这个 APP 不光能选已有的软件,还有 AI 推荐能力。假设我什么都不懂,就在对话框里输入自己遇到的问题,比如:我想更方便地查看 PHP 文件。

AI 就会推荐安装 PHP 环境,可以自由选择版本和操作系统:

然后 AI 快速生成了安装脚本:

点击一键安装,等待一段时间后,也顺利安装成功了:

再来看看 Web 管理后台。用默认管理员密码登录后,可以清晰地看到数据统计,包括软件安装排行和版本选择排行:

还能管理所有已经生成的软件安装方案:

点击编辑,可以对有问题的安装脚本进行人工调整,或者让 AI 重新生成:

还可以看到用户的反馈,比如哪些安装有效、哪些无效,方便人工对无效的方案进行调整和优化:

到这里,所有核心功能都能顺利使用了,以后再有人问我怎么装环境,我直接把这个 APP 甩过去就完事了,夯不夯?
虽然核心功能是正常的,但是运行过程中,你们有没有发现问题?
我发现了 2 个问题:
1)版本号信息搜索能力不够。比如我要装个 Scala,给出来的版本号列表是错误的。
2)Mac 系统过度依赖 homebrew 这个软件包管理工具。homebrew 源的版本不一定全面,比如 Scala 确实有 3.4.2 版本,但通过 homebrew 来安装会失败。

于是我给 AI 下了一条修复指令,让它自主修复这两个问题并进行测试验证。
自主修复 2 个问题,并进行测试验证。
1)安装软件时,版本号列表获取错误。必须优化信息搜索能力,优先从官方信息源获取版本号列表和安装方式,如果没有官方信息源,才降级为通过联网搜索获取版本号信息,最后才是完全交给 AI 推断版本号。
2)Mac 系统默认使用 homebrew 来安装,但是 homebrew 的版本不一定全面,有时可能会安装失败,你需要优先通过官方获取安装方式,homebrew 作为一种备选方案,且要为 homebrew 安装失败时考虑降级方案。
大概 20 分钟后,AI 完成了修复任务。
对于版本号问题,它设计了一套四级降级链路:

对于 macOS 安装问题,它重写了安装策略:

修复后重启服务,再次测试,安装 Codex 命令行工具。这次给出来的版本号是正确的,跟 npm 官方包的版本对上了:

安装脚本也详细了很多,先走官方 GitHub Release 下载,再降级到 homebrew:

当然,可能还有一些边角 case 没有覆盖到,但目前这个效果已经完全够用了,后续在实际使用中再慢慢打磨就好。
看到这里,大家肯定很关心费用吧?
打开 Cursor 后台,看看这次烧了多少米:

第一波完整开发花了 27 刀(约 200 元),Bug 修复那一轮花了 14 刀(约 100 元),总共 300 元左右。
你们觉得花这些米做出来这样一套作品,性价比高么?
虽然价格确实不便宜。但换个角度想,AI 一次性搞出了桌面 APP + 服务端 + 管理后台 3 个完整模块,两轮交互就达到了可用状态,如果换成人工开发,这个工作量差不多得 1 个月左右吧?
对了,开发完之后我顺手用 GitHub MCP,让 AI 帮我把整个项目开源到了 GitHub 上。这种简单任务就不需要用 Fable 5 了,随便一个便宜模型就能搞定。
帮我开源整个项目到 GitHub,注意忽略敏感信息的提交

项目已经开源了,感兴趣的同学可以把代码拉下来二次开发,顺手帮我点个 Star 呗~

回过头来看,为什么 Claude Fable 5 能做到一次性完成可用、两次交互就达到满意效果?
除了模型本身能力确实强之外,还有两个关键因素:
我现在理解为什么 Claude Code 之父和 OpenClaw 之父都在力挺 Loop Engineering 了,这种体验真的爽。
很快我会专门出一篇文章带大家深入掌握 Loop Engineering 的完整玩法,期待的话记得点个关注哦~
但话说回来,要是随便一两句提示词丢给 AI,很有可能就是纯浪费钱。模型越强,对提示词和工程配套的要求就越高。这也是为什么 Claude Fable 5 出来之后,不少同学跟我说感觉自己驾驭不了这个模型,还是 AI 编程的经验和方法没到位。
至少我现在已经用 Claude Fable 5 跑了好几个项目了,感觉真心强得没边儿了,长程复杂任务的交付确定性是目前最好的,就是别偷偷给我降级成 Opus 4.8(
我是鱼皮,持续分享 AI 编程干货。觉得有用的话记得点赞、收藏和关注~
欢迎在评论区聊聊:你们用 Claude Fable 5 了没?感觉怎么样?