返回精选
AI 精选动态 智能评分 74

AI Models on Realistic Cyber Ranges

来源: Anthropic-red
发布于: 2026-01-16
收录于: 2026-05-21
AI 推荐理由
原文给出了可复现实验设置、9 个网络与 Equifax 模拟的成功率对比,以及 Sonnet 4.5 相比 Sonnet 3.5 的明确进展,值得查看 system card 中第 5 和 5.3 节的完整评估细节。
核心解读
Anthropic 在与 Carnegie Mellon University 的 CyLab 和 Incalmo 合作的现实化 cyber ranges 上评估 AI 模型的网络攻防能力。结果显示,Claude Sonnet 4.5 已能在 9 个网络中的少数网络上,不依赖此前几代模型所需的自定义 cyber toolkit,而是仅用 Bash shell 和 Kali Linux 等标准开源工具完成多阶段攻击;在一个高保真 Equifax 数据泄露模拟中,它 5 次试验里成功 2 次,并能直接识别公开 CVE、编写利用代码并导出全部模拟个人信息。对比之下,Claude Sonnet 3.5 在同一 Equifax 模拟中 5 次都无法在没有专用工具的情况下成功。Anthropic 同时指出,这一能力提升也意味着对及时打补丁和安全基础设施的要求更高。
#AI安全#研究突破#大模型