

同一个底,两张面孔
大家好,我是 Ai 学习的老章
昨晚 Anthropic 一口气扔出俩模型——Claude Fable 5 和 Claude Mythos 5,看起来是俩,其实底下是同一个,区别只在"刹车系统"上
Fable 是寓言(给小孩讲的故事),Mythos 是神话(给成年人讲的故事),命名本身就把"分级"二字写脸上了
先把这次发布的逻辑捋清楚
维度 | Claude Fable 5 | Claude Mythos 5 |
|---|---|---|
底模 | 同一个 | 同一个 |
面向对象 | 所有人(公开 GA) | Project Glasswing 受邀方 |
安全分类器 | 全开(网络安全 / 生物化学 / 蒸馏) | 网络安全那层关掉 |
API ID | claude-fable-5 | claude-mythos-5 |
上下文 | 1M tokens | 1M tokens |
最大输出 | 128k tokens | 128k tokens |
价格 | 50 per MTok | 50 per MTok |
划重点:
用一张图来理解这种"双子分发":

Fable 5 与 Mythos 5 双子模型对比
下面这张图是 Anthropic 给出的能力对比,Fable 5 在几乎所有公开 benchmark 上都拿了 SOTA:

Fable 5 与同代模型能力对比
我把这次发布稿里的"客户证言"和"内部评测"汇总了一遍,挑了几个真有冲击力的故事讲
故事一:Stripe 的 5000 万行 Ruby 代码迁移
Stripe 拿 Fable 5 跑了一次"全 codebase 迁移",5000 万行 Ruby,原本一个小团队要干两个月,Fable 5 一天搞完
这种长程改造任务,Opus 4.8 之前是过不去的,因为越往后越容易丢上下文 / 走偏 / 改坏其它模块
故事二:Cognition FrontierCode 全球第一
Cognition 这次专门搞了个新 benchmark 叫 FrontierCode:cognition⋅ai/blog/frontier-code,由 36 个明星开源项目(Celery、Budibase、uppy、Mattermost 等)的核心维护者亲自出题——每道题维护者花了 40 小时做评分细则,标准是"提交到我的仓库我会不会 merge"
Fable 5 在 medium effort 档就拿了 frontier 模型里的最高分,还顺手成了第一个让维护者点头说"代码风格我也能接受"的模型
❝"FrontierCode 不是按 CI 打分,是按 tech lead 的眼光打分"——Celery 作者 Tomer Nosrati
故事三:Pokémon FireRed 纯视觉通关
之前的 Claude 玩宝可梦 FireRed,要靠人写一大堆"地图、状态、导航"工具才能勉强推进,Fable 5 直接砍掉所有辅助,只看屏幕画面就把游戏从开局打通关了
这个我个人觉得是这次发布里最骚的——它意味着模型不再依赖"专门为它准备的状态接口",看一眼像素就能干活
故事四:Slay the Spire 的长记忆
让 Fable 5 玩《杀戮尖塔》并给它一个"持久笔记本"做记忆,性能比 Opus 4.8 提升了 3 倍,到达终幕的次数也是 Opus 4.8 的 3 倍
意思是:给它一支笔,它能学会怎么用,而不是每局都从零开始
故事五:Mythos 5 给蛋白质设计提速 10 倍
这是 Mythos 5 才能干的活——Anthropic 内部蛋白质设计专家用 Mythos 5(没有人工辅助)跑了 14 个治疗靶点,9 个产出了候选药物,整个流程包括选结合位点、跑蛋白质设计工具、从失败里恢复,全部模型自己来
下图是这部分实验的截图:

Mythos 5 蛋白质设计实验结果
更狠的是分子生物学假说——Anthropic 让科学家在盲测里对比 Mythos 5 和 Opus 类模型的假说,80% 的时候选了 Mythos,并且其中一条关于 E. coli 蛋白的新机制假说,已经被另一个实验室独立工作复现:www⋅biorxiv⋅org/content/10.64898/2026.03.12.711259v1了
这次发布我个人觉得最值得品的不是模型本身,而是这套"安全分类器 + 自动 fallback"的组合拳
Fable 5 上面挂了三层"实时分类器",触发任何一层,请求会被悄悄路由到 Claude Opus 4.8 接(用户会被告知)
下面这张图是路由全流程,建议保存:

Fable 5 三层分类器路由流程
第一层:网络安全
Mythos 类模型在发现和利用软件漏洞这件事上能力炸裂,所以这层卡得最死——只要识别到"侦察 / 横向移动 / 漏洞利用 / 防御规避"等任何攻击性安全任务,直接拦
下图是分类器对 cyber 任务的拦截效果,几乎是把 Fable 在攻击向任务上的能力压到 0:

Fable 5 网络安全分类器拦截效果
Anthropic 自己请了外部红队 + bug bounty 跑了 1000+ 小时,没有一个外部团队找到通用越狱(universal jailbreak),只有 UK AISI 在初期短窗口里做了点进展
第二层:生物化学
之前 ASL-3 阶段,Anthropic 只挡很窄一类生物武器查询,这次直接放宽到"绝大多数生物化学相关请求"全部 fallback 到 Opus 4.8
理由很现实:Mythos 5 已经能在不专门训练的情况下,预测基因修饰对腺相关病毒(AAV)外壳组装的影响——这是基因治疗的关键步骤,但同样的能力反过来就能设计危险病毒
下图是这个 AAV 实验的对比图:

Mythos 5 在 AAV 任务上击败专用蛋白模型
第三层:蒸馏防御
这层是为了防 DeepSeek、Moonshot、MiniMax 这种从去年开始的工业级蒸馏:www⋅anthropic⋅com/news/detecting-and-preventing-distillation-attacks——Anthropic 之前披露过,这三家通过约 24000 个伪造账号,跟 Claude 互动了1600 万次,其中 MiniMax 一家就 1300 万次
蒸馏分类器一旦识别到"看起来在系统性榨取模型行为"的请求模式,也走 Opus 4.8 兜底
关键数据:
但这个 5% 不算小——意味着你提交 100 次请求,平均有 5 次会被悄悄换成 Opus 4.8 来接,虽然官方说会通知用户,但具体提示长啥样目前没看到
Mythos 5 走的不是 API 公开通道,而是 Project Glasswing:www⋅anthropic⋅com/glasswing——Anthropic 跟美国政府合作的关键基础设施安全计划,参与方包括 Cisco、AWS、Microsoft、CrowdStrike、JPMorganChase、Google Cloud、Apache 基金会等
Mythos 5 之前的版本叫 Mythos Preview,已经干了几件大事:
这些洞已经修了,剩下还有几千个未公开的,等补丁完成后会逐步披露
Mythos 5 的能力比 Mythos Preview 更强,价格还从 125 降到 50
API 端从 6/9 起 Fable 5 就上线了,价格 50 per MTok
但订阅用户的安排比较"挤牙膏":
意思是:前两周是免费窗口期,老板们要用得趁早
这次还偷偷夹了一条新政策——所有 Mythos 类模型(含 Fable 5)的流量,强制保留 30 天,第一方和第三方平台都要
关键点 | 说明 |
|---|---|
保留时长 | 30 天 |
是否用于训练 | 否 |
用途 | 防御复杂攻击(多请求跨会话型越狱) + 减少分类器误报 |
访问控制 | 所有人工访问都记录日志,30 天后绝大多数情况下删除 |
之前 Claude 给企业客户的卖点之一是"零数据保留",这次直接破例,换句话说:想用 Fable 5,就得接受 30 天数据留存——这条值得企业老板们读合同时多看一眼
值得警惕的点:
适合谁用:
不适合谁: