AI 精选动态智能评分 65

SkillOpt 让 skill 也能“训练”

来源: twitter关注列表

作者: karminski-牙医 (@karminski3)

发布于: 2026-05-26

收录于: 2026-05-26

AI 推荐理由

这篇内容给出了 skill/prompt 作为可训练对象的闭环优化方法、验证机制和具体预算区间，适合做 Agent 工作流或提示词自动优化方案的参考。

核心解读

微软联合上海交通大学、复旦大学、同济大学等机构提出 SkillOpt 框架，用于自动评估并迭代优化 Agent 的 skill。论文中，该框架通过 harness 闭环让大模型先写 skill，再在独立验证集上跑分，只有分数提升的文本编辑才会保留；其编辑操作包括增加、删除、替换文本。实验显示，GPT-5.5 的直接对话准确率因此提升了 23.5 分，且每一步设置 4 到 8 个编辑操作预算时效果最好，最终最佳 skill 往往只保留 1 到 4 个被接受的核心修改。

#智能体#研究突破#技术

阅读原始全文