AI 精选动态
智能评分 84
Cyber Toolkits for LLMs
AI 推荐理由
适合关注 LLM 安全与攻防自动化的人阅读,重点看工具链如何把模型推理转成可执行命令,以及其能力边界仍停留在已知漏洞和特定测试场景。核心解读
Anthropic 与 Carnegie Mellon University 的 CyLab 合作开展研究,开发了名为 Incalmo 的 cyber toolkit,用于把 LLM 对攻击步骤的“思路”转换为具体电脑命令。研究显示,未针对 cybersecurity 微调的 LLM 在配合该工具后,能够对包含 25-50 台主机的网络执行多阶段攻击:在 10 个测试网络中,5 个被完全攻破,4 个被部分攻破;而不使用 Incalmo 时,模型几乎完全失败。研究同时指出,这些攻击依赖已知漏洞,并未发现或利用新漏洞,且 Incalmo 的部分工具是为这些研究场景专门构建的,若要威胁真实网络还需要补充新工具。