返回精选
AI 精选动态 智能评分 65

SIA 自我改进框架

来源: twitter关注列表
作者: meng shao (@shao__meng)
发布于: 2026-05-28
收录于: 2026-05-28
AI 推荐理由
原文给出了自我改进型 agent 的具体机制,以及在 MLE-Bench 上超过 MLEvolve 和 AIRA-dojo、并持续刷新自身成绩的结果,值得关注其方法是否可复现及是否会影响 agent 评测范式。
核心解读
Sumanth 引用并转发了关于 Self Improving AI(SIA)的帖子,称该框架可以让任意 AI 系统在基准任务上通过自我反馈循环持续提升性能。原文称 SIA 在每次运行后会同时更新自身的 harness、底层模型权重和 memory layer;在 OpenAI 的 MLE-Bench 上,它登上排行榜首位,超过了专门的 ML research agent,包括 MLEvolve 和 AIRA-dojo,并且后续还能继续超越自己之前的版本。引用原帖还提到,@hexoai 已开源发布 SIA,目标是通过递归自我改进完成任意目标。
#开源#智能体#基准测试