Anthropic代码安全模型Mythos：潜力与局限并存

文章来源：企鹅号 - 至顶科技

回顾来看，将这款产品命名为"Mythos"或许是一个埋下隐患的选择。Anthropic本意可能是想借助这个名字，暗示其AI代码安全模型拥有近乎神话般的能力，但这个词还有另一层含义——一套来源模糊、与现实格格不入的信念体系。

现实情况正在逐渐浮出水面，而结果远没有神话那般光鲜。Mythos是一款出色的工具，能够自动化完成许多原本需要人类专家完成的工作，但从中获益最大的，依然是那些经验丰富的专家。它非常擅长发现人类已知的漏洞类型，却难以识别那些尚未被人类归纳总结的漏洞——这正是训练数据局限性的体现。Anthropic将早期访问权限制在真正有需求的可信合作伙伴范围内（即"Glasswing项目"），这种做法在将技术能力用于正途方面体现了负责任的态度，但其他不受限制的大语言模型在这一领域同样表现不俗。有一些夸大宣传，也有一些真实价值，大语言模型的特性使然。

Mythos发现了Firefox中的271个安全漏洞——但无一超出人类专家的发现范围。

若说此次唯一真正的创新仅在于一家AI公司做到了合乎道德地运营，这未免过于刻薄。同样刻薄的看法是，将封闭式推出及随之而来的宣传攻势，视作纯粹的炒作行为。更具建设性、可以说更为准确、也更令人振奋的解读是：将这一切视为更美好未来的早期预兆。在那个未来中，威胁态势将不再受制于我们无法掌控的地质与气候力量，而是转变为一片可被培育、可被掌控、令人满意地归于平静的领域。

以下两个命题指明了方向：其一，Mythos此类工具的能力将持续演进，揭露出越来越多的结构性与个体性代码缺陷；其二，这些工具将不可避免地走向普及。普及的速度与成本或许可以加以管控，但最终结果无可避免。在IT领域，没有什么秘密能够长久保守。

放眼当下乃至未来相当长一段时间，绝大多数正在运行的代码都诞生于漏洞检测的"前工业时代"——靠的是人眼，而非AI。在这样糟糕的公共环境中，贸然放出一批四处游荡、锲而不舍的漏洞猎手机器人，后果堪忧。如果它们来得太早，局面将会一团糟。但它们终将到来。

倘若我们能够安然度过这段过渡期，那就让机器人尽情驰骋吧。有一类代码是绝对不存在安全风险的，那便是从未部署的代码。新代码存在诸多问题，有些在部署前被发现，有些则没有，但问题的数量终归是有限的。只要拥有真正卓越的工具，代码就可以在发布前被打磨得足够优秀。即便此后同样的工具落入攻击者手中，也无关大局。

航空安全是一个被频繁援引的优质参照。喷气式飞机时代初期，新型客机因结构与机械缺陷频频坠毁。随着时间推移，设计和材料知识不断积累，工程与监管体系也随之同步演进。如今虽仍有事故发生，但每一起事故最终都能追溯到本可避免、本应做好却未做好的环节，再无任何潜伏于暗处、尚待发现的新型故障等待引爆。代码领域极有可能遵循同样的规律——毕竟，软件编程与喷气式飞行的历史几乎同步开始。

仅仅修复代码漏洞并不足以解决所有安全问题，就如同造出并驾驭极度安全的飞机，并不能阻止燃油污染、鸟群撞击或人为失误导致的事故一样。但这确实大有裨益。审视那些基于一长串已知与未知漏洞构建的攻击链可以发现，代码的脆弱性令人咋舌，但同时也说明：只要消除其中任意一个漏洞，就能斩断整条攻击链。"瑞士奶酪模型"所描述的失效方式，会随着奶酪越来越趋近于切达奶酪（即漏洞越来越少）而愈发失效。

至于代码之外的那些漏洞——供应链攻击、社会工程学手段、内部人员蓄意破坏——只要我们能够对其进行编码、建模与训练，同样可以交由推理引擎以其无穷的耐心加以处理。而在大量企业基础设施仍在运行老旧、未打补丁或配置错误的系统的当下，这无异于驾驶着"死亡年代"的老旧飞机飞行。IT领域并不存在一个类似美国联邦航空管理局那样有权强制停飞不合格飞机的机构，尽管这样的假设颇具想象空间。

但这一切终将改变。一款能够批量发现数百个漏洞的工具，必然会让旧代码变得更安全，让新代码的安全性大幅跃升，这一点毋庸置疑。同样值得期待的是，漏洞发现工具将如何与代码设计、分解和编写的技术并驾齐驱，共同朝着从根本上增强代码健壮性的方向演进。没有人应该认为现状已是最高效、最经济的解决方案，也没有人应该认为人类专家将就此退出历史舞台。大量航空安全事件最终都指向人为因素，恰恰说明人类在设计、建造、维护和飞行操控等环节中仍不可或缺。

让计算机做计算机擅长的事，让人类做人类擅长的事——这话说了很久，却依然正确。数十年的数字生活告诉我们，人类并不擅长安全，计算机也未必出色。借用另一句老话：给我们工具，我们就能完成任务。Mythos目前还不是那把能让我们竟功的工具。从整体来看，AI似乎仍在让事情变得更加复杂。

但现在，我们终于看到了一条前行之路——一种很可能真正实现的全新运作方式。曾经的威胁态势，有望蜕变为一片生长着美好事物的花园。这并非神话，这就是未来。

Q&A

Q1：Mythos是什么？它在代码安全方面的能力如何？

A：Mythos是Anthropic开发的一款AI代码安全模型，能够自动化完成许多原本由人类安全专家执行的漏洞检测工作。它在识别人类已知漏洞类型方面表现出色，例如成功发现了Firefox中的271个安全漏洞，但其局限性在于难以发现训练数据中未曾涵盖的未知漏洞类型。总体而言，它是一款实用工具，但目前尚未达到"神话级别"的能力。

Q2：Mythos为什么采用封闭式推出策略？

A：Anthropic通过"Glasswing项目"将Mythos的早期访问权限制在有真实需求的可信合作伙伴范围内。这一策略被认为是负责任的做法，旨在避免强大的漏洞检测工具在代码安全生态尚未完善的环境中被滥用。由于当前大量运行中的代码都诞生于漏洞检测的"前工业时代"，过早大规模开放此类工具可能会引发安全混乱。

Q3：AI代码安全工具普及后会带来哪些影响？

A：随着Mythos此类工具不断演进并走向普及，代码安全有望从根本上得到改善。新代码可以在发布前被充分检测和修复，旧代码的安全性也将逐步提升。文章以航空安全为类比：随着工程与监管体系的成熟，已知故障类型得到系统性消除。AI代码安全工具有望推动软件行业实现类似的转变，但人类专家的角色在可预见的未来仍不可替代。

发表于: 2026-04-282026-04-28 00:08:08
原文链接：https://page.om.qq.com/page/O_joF2OxZzAQ4YradKIW0n0Q0
腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号（企鹅号）传播渠道之一，根据《腾讯内容开放平台服务协议》转载发布内容。
如有侵权，请联系 cloudcommunity@tencent.com 删除。

Anthropic代码安全模型Mythos：潜力与局限并存

相关快讯

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐