就在今天,财富杂志爆料,Anthropic 因为内容管理系统 CMS 配置失误,导致近 3000 个未发布资产(包括草稿博客文章)被公开放置在一个可公开搜索的数据缓存中,意外泄露了尚未发布的新模型信息。
很快,Dario 也承认了这个新模型的存在。
泄露的博客显示,这一新模型全面超越了 Opus 4.6,堪称迄今为止 Anthropic 开发过的最强大 AI 模型。
Anthropic 的一位发言人称,它代表了AI 性能上的一次跃迁。
目前,Anthropic 已经关闭了公众搜索和获取这些内容的权限。还好有大神眼疾手快,把这篇草稿保存了下来。
https://m1astra-mythos.pages.dev
草稿博客文章详细描述了新模型,有两个版本,分别是 Mythos 和 Capybara 两个全新的称呼,而描述的内容却是完全一致的。
Anthropic 是故意的,还是不小心的?
Anthropic 的王炸大模型还没捂热乎,就这么泄露了?!
事情的起因很有戏剧性。
官方在对 fortune 的回应中表示,这只是一次人为的操作失误。
他们用的第三方 CMS 工具,上传的文件默认就是公开的,除非手动改成私密。有人忘了改,于是包括这个重要的草稿在内,将近 3000 个内部资产就这么裸奔在公网上了。
偏偏《财富》杂志认真浏览了这批内部文件,就发现了这个惊天大瓜。
我暂且相信这次不是 Anthropic 的有意炒作。
因为同批泄露的,还有一名员工的育儿假文件,以及一场 Dario Amodei 将出席、在英国乡村庄园举行的欧洲 CEO 闭门峰会的详细信息。
这更像是官方无意放出的一个迷雾弹,还有很多人在猜,谁是代号,谁是“真名”。
目前主流的观点和网友 M1 比较类似,认为 Claude Mythos 才是新模型的名字,而 Capybara 则是内部的代号。
所以在下文,我们暂且将其称为 Mythos 。
更极致的性能提升
在这篇泄漏的草稿中,Anthropic 将 Mythos 描述为一个全新的模型层级:
比 Opus 4.6 更大、更强,运行成本更高,同时订阅价格也更高昂。
不仅如此,与 Opus 4.6 相比,其在软件编程、学术推理以及网络安全等测试中的分数均有显著提高。
Anthropic 内部说,这是迄今为止他们开发过的最强大的 AI 模型。
我们都知道,Anthropic Claude 现有的模型产品线分为三档:
Haiku(最小最快),Sonnet(中间档),Opus(最大最强)
而 Mythos 将成为 Opus 之上的第四档。
目前 Anthropic 已经完成了对 Claude Mythos 的训练。
但是由于种种原因,只有少数早期接入客户在内测,暂时没有对公众开放。
巨大的安全隐患也在降临
那么话又说回来,为什么训练完了这么厉害的模型,Anthropic 却不敢公开?
原因之一是——这个模型强大到连 Anthropic 自己都有点害怕。
泄露的草稿中说:
这一系统在网络能力方面目前远远领先于其他任何 AI 模型。
也就是说,Mythos 能够以远超防御者应对能力的方式利用漏洞。
黑客拿到它,可能会发动规模远超以往的自动化网络攻击。
Anthropic 也坦言,他们这次格外谨慎,希望能够全面理解 Mythos 带来的风险——
不仅仅是自身测试中发现的那些,还会重视在短期内在网络安全领域可能造成的真实威胁。
这个担忧不无道理。毕竟同期,Opus 4.6 就已经能在生产代码库中发现此前从未被发现过的漏洞了。
当 AI 的攻击能力开始跑赢防御能力,网络安全防御将会面临更大的风险。
所以 Anthropic 这回的发布策略是,先向网络安全防御机构开放早期访问权限,让他们抢先用这个模型来加固自己的代码库。在黑客大规模利用之前,先把漏洞堵上。
可惜的是,我们与 Mythos 正式见面的时间,又要晚一些了。