OpenAI 的网络安全模型刚刚击败了美国政府下线的 Anthropic Mythos AI 模型,而且它仍在正常运行。
6 月 22 日,OpenAI 宣布全面启动 GPT-5.5-Cyber,作为其 Daybreak 网络防御计划的一部分。 CyberGym 是加州大学伯克利分校开发的基准测试,它向人工智能代理展示了来自 188 个开源项目的 1,507 个已知软件漏洞,并根据它们在受控环境中可以重现的数量对其进行评分,更新后的模型达到了 85.6%。
Anthropic 的《Mythos 5》在同一排行榜上的支持率为 83.8%。 Anthropic 的更广泛可用的模型 Claude Opus 4.7 得分为 73.1%。
任何基准测试中小于两点的差距通常都不会引起太大的影响。这里的上下文不是。在唐纳德·特朗普政府以国家安全为由发布紧急出口管制指令后,Anthropic 的《神话 5》和《神鬼寓言 5》于 6 月 12 日下线。
政府指出越狱是一种绕过人工智能模型内置安全限制的技术,类似于找到一把打开高安全性门的万能钥匙。 Anthropic 没有可靠的方法来大规模验证用户国籍,因此它对任何地方的每个人都禁用了这两种模型。
一些损害是自己造成的。 Anthropic 花了几个月的时间将 Mythos 描述为有史以来最强大、最危险的人工智能模型之一,并在其自己的发布文档中警告称,如果没有适当的限制,其网络安全能力可能会造成严重损害。 Anthropic 首席执行官 Dario Amodei 于 6 月 10 日发表了一篇文章,将前沿人工智能模型与飞机进行比较,如果飞机未通过审核,安全监管机构应该能够停飞。
几天后,政府停飞了 Anthropic 的飞机。
这并不是那周唯一的警报。 Anthropic 已经因《神鬼寓言 5》中的一个隐藏过滤器而已经受到批评,该过滤器在没有告知用户的情况下,悄悄降低了其怀疑构建竞争人工智能的用户的模型输出,并被迫道歉并撤销了该政策。
不同的剧本
在 Anthropic 与商务部谈判并继续对特朗普政府提起诉讼的同时,OpenAI 正在扩大其影响范围。 Daybreak 已与澳大利亚、加拿大、法国、德国、日本、韩国和欧盟机构包括欧盟网络安全局签署了网络安全合作伙伴关系。
包括 CrowdStrike、Cisco 和 Cloudflare 在内的 28 家安全公司已加入其网络合作伙伴计划,将 GPT-5.5 嵌入到其产品中,供经过审查的客户使用。根据 OpenAI 自己的博客,自 3 月份推出以来,Codex Security 工具已扫描了 30,000 个代码库中超过 3000 万次提交,并记录了超过 500,000 个已修复的漏洞。
该公司还在扩大合作伙伴计划,以便安全公司可以将这些功能集成到自己的工具中,并推出了“Patch the Planet”计划,旨在帮助修复广泛使用的开源项目中的漏洞。
也就是说,GPT-5.5-Cyber 不适合一般用途。它仅适用于经过验证的安全专业人员,并且 OpenAI 在发布前与联邦机构(包括人工智能标准与创新中心和国家网络总监办公室)进行了部署前测试。这与 Anthropic 与 Mythos 尝试的限制访问方法相同,但 OpenAI 首先向政府澄清了其方法。
截至 6 月 23 日,《神鬼寓言 5》和《神话 5》仍处于离线状态——已暂停 11 天,Anthropic 或商务部尚未给出正式恢复日期。
