- AI HOT 精选动态

AI 精选动态智能评分 60

来源: twitter关注列表

作者: Ethan Mollick (@emollick)

发布于: 2026-05-15

收录于: 2026-05-15

AI 推荐理由

涉及英国AI安全研究所的权威模型评估更新，包含具体性能数据和评估方法讨论，对AI安全研究者和从业者有一定参考价值。

核心解读

UK AISI发布Mythos Preview模型在网络攻击评估中的新数据，新版本在32步企业网络攻击任务中可完成6/10，同时讨论了评估中按token与按美元计算的性能差异，验证了第二缩放定律通过增加思考token可持续提升LLM表现。

#AI安全#模型评估#缩放定律