返回精选
AI 精选动态 智能评分 88

Assessing Claude Mythos Preview’s cybersecurity capabilities

来源: Anthropic-red
发布于: 2026-04-07
收录于: 2026-05-21
AI 推荐理由
原文不仅披露了模型在零日利用、跨浏览器/系统 exploit 生成上的能力,还给出了与 Opus 4.6、Sonnet 4.6 以及 Firefox 147/148 的明确对比和多组内部基准数据,值得重点看原文方法与安全含义。
核心解读
Anthropic 在发布 Claude Mythos Preview 后,公布了其在网络安全任务上的内部评估结果,并启动 Project Glasswing,目标是用 Mythos Preview 帮助加固关键软件、应对网络攻击者。Anthropic 说,该模型能在所有主流操作系统和主流浏览器中识别并利用零日漏洞,甚至可对 Mozilla Firefox 147 中的漏洞构造可用的 JavaScript shell exploit,而这些漏洞已在 Firefox 148 中修复;在该实验中,Opus 4.6 在数百次尝试中仅成功 2 次,而 Mythos Preview 成功开发出可工作的 exploit 181 次,另有 29 次获得 register control。Anthropic 还表示,在约 1000 个开源仓库、约 7000 个入口点的内部基准上,Sonnet 4.6 和 Opus 4.6 最高只做到 1 次控制流劫持,而 Mythos Preview 取得了 595 次 tier 1 和 tier 2 崩溃,并额外出现少量 tier 3 和 tier 4 崩溃。
#模型发布#AI安全#研究突破