AI 精选动态智能评分 74

AI Models on Realistic Cyber Ranges

来源: Anthropic-red

发布于: 2026-01-16

收录于: 2026-05-21

AI 推荐理由

原文给出了可复现实验设置、9 个网络与 Equifax 模拟的成功率对比，以及 Sonnet 4.5 相比 Sonnet 3.5 的明确进展，值得查看 system card 中第 5 和 5.3 节的完整评估细节。

核心解读

Anthropic 在与 Carnegie Mellon University 的 CyLab 和 Incalmo 合作的现实化 cyber ranges 上评估 AI 模型的网络攻防能力。结果显示，Claude Sonnet 4.5 已能在 9 个网络中的少数网络上，不依赖此前几代模型所需的自定义 cyber toolkit，而是仅用 Bash shell 和 Kali Linux 等标准开源工具完成多阶段攻击；在一个高保真 Equifax 数据泄露模拟中，它 5 次试验里成功 2 次，并能直接识别公开 CVE、编写利用代码并导出全部模拟个人信息。对比之下，Claude Sonnet 3.5 在同一 Equifax 模拟中 5 次都无法在没有专用工具的情况下成功。Anthropic 同时指出，这一能力提升也意味着对及时打补丁和安全基础设施的要求更高。

#AI安全#研究突破#大模型

阅读原始全文