AI 精选动态
智能评分 65
SkillOpt 让 skill 也能“训练”
AI 推荐理由
这篇内容给出了 skill/prompt 作为可训练对象的闭环优化方法、验证机制和具体预算区间,适合做 Agent 工作流或提示词自动优化方案的参考。核心解读
微软联合上海交通大学、复旦大学、同济大学等机构提出 SkillOpt 框架,用于自动评估并迭代优化 Agent 的 skill。论文中,该框架通过 harness 闭环让大模型先写 skill,再在独立验证集上跑分,只有分数提升的文本编辑才会保留;其编辑操作包括增加、删除、替换文本。实验显示,GPT-5.5 的直接对话准确率因此提升了 23.5 分,且每一步设置 4 到 8 个编辑操作预算时效果最好,最终最佳 skill 往往只保留 1 到 4 个被接受的核心修改。