AI 精选动态智能评分 88

Assessing Claude Mythos Preview’s cybersecurity capabilities

来源: Anthropic-red

发布于: 2026-04-07

收录于: 2026-05-21

AI 推荐理由

原文不仅披露了模型在零日利用、跨浏览器/系统 exploit 生成上的能力，还给出了与 Opus 4.6、Sonnet 4.6 以及 Firefox 147/148 的明确对比和多组内部基准数据，值得重点看原文方法与安全含义。

核心解读

Anthropic 在发布 Claude Mythos Preview 后，公布了其在网络安全任务上的内部评估结果，并启动 Project Glasswing，目标是用 Mythos Preview 帮助加固关键软件、应对网络攻击者。Anthropic 说，该模型能在所有主流操作系统和主流浏览器中识别并利用零日漏洞，甚至可对 Mozilla Firefox 147 中的漏洞构造可用的 JavaScript shell exploit，而这些漏洞已在 Firefox 148 中修复；在该实验中，Opus 4.6 在数百次尝试中仅成功 2 次，而 Mythos Preview 成功开发出可工作的 exploit 181 次，另有 29 次获得 register control。Anthropic 还表示，在约 1000 个开源仓库、约 7000 个入口点的内部基准上，Sonnet 4.6 和 Opus 4.6 最高只做到 1 次控制流劫持，而 Mythos Preview 取得了 595 次 tier 1 和 tier 2 崩溃，并额外出现少量 tier 3 和 tier 4 崩溃。

#模型发布#AI安全#研究突破

阅读原始全文