AI 精选动态智能评分 72

SkillOpt: Executive Strategy for Self-Evolving Agent Skills

来源: twitter关注列表

作者: Rohan Paul (@rohanpaul_ai)

发布于: 2026-05-29

收录于: 2026-05-29

AI 推荐理由

适合关注 agent 工程与提示/技能优化的人直接阅读，重点看其“冻结模型、只训练可审计 skill file”的训练范式，以及 52 个案例和 GPT-5.5 上 23.5 分提升的可复现性。

核心解读

Microsoft 提出 SkillOpt，用于训练 agent skills：不是更新主模型，而是迭代一个可复用的 skill document。该方法先观察 agent 处理任务时的成功与失败，再由更强的优化器模型提出对 skill 的小幅编辑，并且只在新 skill 通过 held-out check set 时才接受修改，避免 skill 因“看起来合理”的编辑而退化。作者在 6 个 benchmark、7 个目标模型和 3 种 agent 设置（direct chat、Codex、Claude Code）上测试，52 个测试案例中 SkillOpt 全部达到最佳或并列最佳；在 GPT-5.5 的 direct chat 设置下，平均 accuracy 提升 23.5 个百分点。

#研究突破#智能体#开发者工具

阅读原始全文