
Stripe有一个5000万行的Ruby代码库,需要做架构迁移。团队评估:大约需要两个月。他们把任务丢给了Claude Fable 5。一天搞定。
2026年6月9日,Anthropic同时发布了两个模型:Claude Fable 5和Claude Mythos 5。
这不是常规的版本迭代。这是Anthropic第一次把Mythos级能力开放给普通用户。
先说几个关键数据:
但最有意思的不是它有多强,而是它的"护栏"设计—— Fable 5和Mythos 5是同一个模型,区别在于安全限制的开关。这是Anthropic第一次把"能力"和"安全"彻底解耦。
今天这篇文章,讲清楚Fable 5 / Mythos 5的技术能力、安全架构、以及实战中怎么用好它。
这是最容易搞混的地方:Fable 5和Mythos 5的底层模型完全一样。

用人话说:Fable 5是带安全带的超跑,Mythos 5是取掉限速器的同款超跑——但只有拿到赛道许可证的人才能开。
以前的做法是:强模型只给政府/企业用,弱模型给公众用。
Anthropic的做法不同:给所有人同样强的模型,但在敏感领域加软件护栏。 95%以上的使用场景不受影响,只有涉及网络安全攻击、生物武器、模型蒸馏时才会触发。
这意味着:你用Fable 5写代码、做分析、搞研究,体验和Mythos 5完全一样。

Fable 5在FrontierCode(Devin团队出的评测)上拿下所有前沿模型最高分,CursorBench SOTA,ViBench端到端编码基准最高。最炸裂的实战案例:Stripe用它1天完成了原本预计2个月的5000万行Ruby代码库迁移。
Fable 5在编码上的提升不仅是"更准",更关键的是更省Token。同样的任务,它比之前的Claude版本用更少的Token完成,这直接影响成本和速度。
Hebbia Finance Benchmark所有前沿模型最高分。文档分析能精准提取图表数字,概念推理支持高级推理+根因分析。
法律领域的盲审测试中,Fable 5表现优于所有对手模型。在物理学研究中,Token效率是GPT-5.5的3倍。
Fable 5的视觉能力是当前所有模型中最强的:
最后一条听起来像是在搞笑,但它证明了一个严肃的能力:长时间、多步骤、视觉驱动的自主决策。 一个游戏通关需要数百个连续决策,每个决策都基于屏幕画面。这比任何基准测试都更能体现Agent的实际能力。
Fable 5支持跨百万Token的自主操作,文件记忆性能是Opus 4.8的3倍,游戏最终章到达率提升3倍。
Fable 5的文件记忆系统(file-based persistent memory)是一个重要特性:它不是简单的上下文窗口,而是能在极长的任务中持续维护和检索信息。
这是Mythos 5最震撼的能力领域:
基因组学的结果尤其惊人: 模型自主进行了一周的研究,自己收集数据、自己设计实验、自己训练机器学习模型——最终结果超越了发表在Science上的人类研究,而且模型大小只有原论文的1%。
Fable 5相比Mythos 5,开启了三层安全护栏:网络安全护栏(触发时拒绝执行)、生化护栏(触发时降级到Opus 4.8回答)、蒸馏保护(触发时拒绝配合)。
第二条很有意思: 不是直接拒绝,而是悄悄切换到Opus 4.8来回答。这意味着用户仍然能得到回答,但回答的能力被限制在了上一代模型的水平。
Anthropic公布了一个关键数据:
平均触发率:不到5%。95%以上的会话不受任何影响。
1000+小时的外部红队测试没有找到通用越狱方法。
Mythos级模型有一个特殊要求:
这是能力与安全的交换条件。 你获得了Mythos级的能力,代价是30天的流量留存。对大多数场景来说这不是问题,但如果你处理的是极度敏感的数据(比如律师-客户特权通信),需要注意这一点。
Fable 5是目前最贵的通用模型——输入10美元/百万Token,输出50美元/百万Token。 比Mythos Preview的价格低了一半以上。
但考虑到它的Token效率更高(同样任务用更少Token),实际成本差距可能没有标价看起来那么大。和DeepSeek R1比,价格是它的23倍——但能力维度完全不同。
老周的建议:如果你想免费体验Fable 5,抓紧6月22日之前的窗口期。 23号之后就要额外付费了。
Mythos 5的获取渠道:Project Glasswing合作伙伴可解除网络安全护栏;生物研究者计划即将开放申请,可解除生化护栏;网安机构计划即将开放,可解除网络安全护栏。

实践一:大规模代码迁移
Stripe的案例给出了模板:
1 1. 让Fable 5先读懂整个代码库的架构
2 2. 制定迁移计划(它的规划能力远超Opus)
3 3. 分批执行迁移,每批后自动运行测试
4 4. 失败时自主诊断和修复关键点:不要一次丢一个文件,丢整个项目让它理解全局。 Fable 5的长上下文和记忆能力是它最大的差异化优势。
实践二:利用Token效率优势
Fable 5比之前的Claude版本更省Token。实际做法:
实践三:利用文件记忆做长周期任务
Fable 5的file-based memory让它可以在极长任务中维护状态。最佳实践:
1 1. 在任务开始时创建一个"研究日志"文件
2 2. 让模型在每个阶段将关键发现写入日志
3 3. 在后续阶段让模型先回顾日志再行动
4 4. 这比纯靠上下文窗口的效果好3倍实践四:视觉分析流水线
Fable 5的视觉能力可以构建强大的自动化流水线:
1 PDF报告 → Fable 5提取图表数据 → 结构化JSON
2 竞品截图 → Fable 5分析UI模式 → 生成类似代码
3 手绘原型 → Fable 5理解意图 → 完整前端代码策略一:路由分层

策略二:Prompt精简
Fable 5理解力更强,你可以:
策略三:结果缓存
1. 生 Prompt Caching(省输入)
:把固定不变的部分——System Prompt、长文档、few-shot 示例——放在 prompt 前缀并标记缓存。后续命中同一前缀的调用,这部分输入按大幅折扣计费。这是和策略二配合最紧的一招:精简之外,剩下的固定内容用缓存兜住。
2.应用层结果缓存(省整次调用)
:对完全相同的查询(做好归一化:去空格、统一大小写、去无关参数),直接返回上次存的答案,连 API 都不调。最适合 FAQ、固定报表、模板类请求。
3. 语义缓存(谨慎用于相似查询)
:用 embedding 计算查询相似度,超过高阈值(比如 0.95+)才复用。务必设白名单——只在"措辞变了但答案不变"的场景开启,时效类、含具体数值/日期的查询一律绕过。
Fable 5值不值50美元/百万输出Token?
一个实用的判断标准:如果这个任务用Opus 4.8需要反复尝试3次以上才能成功,用Fable 5可能一次就行——算上重试的Token成本,Fable 5反而更便宜。
虽然95%的会话不受影响,但以下场景需要注意:
对大多数团队来说,30天留存不是问题。但如果你处理以下数据,请注意:
建议:敏感数据在发送给API前做脱敏处理。 这不是Fable 5特有的建议——任何第三方API调用都应该这么做。
Claude Fable 5的发布,标志着AI行业进入了一个新阶段:最强的模型不再是实验室的专属。
以前,"最强模型"意味着只有少数研究机构或政府合作伙伴能用。Anthropic用Fable 5打破了这个惯例——把Mythos级的能力直接给所有用户,同时通过精确的护栏设计控制风险。
95%的场景不受影响,5%的敏感场景被精确拦截。 这比"要么全开要么全关"的二元策略高明太多了。
从实用角度看,Fable 5最大的价值不是"跑分最高"——而是在长时间、跨百万Token的复杂任务中表现稳定。Stripe的5000万行代码迁移、一周的自主基因组学研究——这些不是5分钟能完成的基准测试,而是需要模型持续数小时甚至数天保持高质量输出的真实场景。
这才是Fable 5真正拉开差距的地方。
一句话总结:Fable 5不是"更好的聊天机器人",而是"更可靠的AI工程师"。它的价值不在单次对话,而在长周期的自主执行。