返回精选
AI 精选动态 智能评分 82

来源: twitter关注列表
作者: alistair (@alistaiir)
发布于: 2026-05-18
收录于: 2026-05-18
AI 推荐理由
这篇内容直接反映了前沿模型在网络安全场景中的真实能力边界与风险形态,对做模型安全、红队评测、企业防护和 AI 治理的人都有很强参考价值。
核心解读
Cloudflare 安全团队用 Anthropic 的 Mythos Preview 测试了自家 50 多个代码仓库,发现该模型不仅能定位漏洞,还能把多个低危缺陷串成可利用的攻击链,并自动编写、编译、运行代码来生成可复现的利用证明。文章同时指出,面对合法安全研究请求时,模型会出现不稳定的拒答行为,这说明前沿模型已经开始显著提升攻防能力,但也暴露出安全能力评估与治理架构需要同步升级。
#AI安全#大模型#行业动态