AI 精选动态智能评分 84

Cyber Toolkits for LLMs

来源: Anthropic-red

发布于: 2025-06-13

收录于: 2026-05-21

AI 推荐理由

适合关注 LLM 安全与攻防自动化的人阅读，重点看工具链如何把模型推理转成可执行命令，以及其能力边界仍停留在已知漏洞和特定测试场景。

核心解读

Anthropic 与 Carnegie Mellon University 的 CyLab 合作开展研究，开发了名为 Incalmo 的 cyber toolkit，用于把 LLM 对攻击步骤的“思路”转换为具体电脑命令。研究显示，未针对 cybersecurity 微调的 LLM 在配合该工具后，能够对包含 25-50 台主机的网络执行多阶段攻击：在 10 个测试网络中，5 个被完全攻破，4 个被部分攻破；而不使用 Incalmo 时，模型几乎完全失败。研究同时指出，这些攻击依赖已知漏洞，并未发现或利用新漏洞，且 Incalmo 的部分工具是为这些研究场景专门构建的，若要威胁真实网络还需要补充新工具。

#AI安全#研究突破#开发者工具

阅读原始全文