AI 精选动态智能评分 65

SIA 自我改进框架

来源: twitter关注列表

作者: meng shao (@shao__meng)

发布于: 2026-05-28

收录于: 2026-05-28

AI 推荐理由

原文给出了自我改进型 agent 的具体机制，以及在 MLE-Bench 上超过 MLEvolve 和 AIRA-dojo、并持续刷新自身成绩的结果，值得关注其方法是否可复现及是否会影响 agent 评测范式。

核心解读

Sumanth 引用并转发了关于 Self Improving AI（SIA）的帖子，称该框架可以让任意 AI 系统在基准任务上通过自我反馈循环持续提升性能。原文称 SIA 在每次运行后会同时更新自身的 harness、底层模型权重和 memory layer；在 OpenAI 的 MLE-Bench 上，它登上排行榜首位，超过了专门的 ML research agent，包括 MLEvolve 和 AIRA-dojo，并且后续还能继续超越自己之前的版本。引用原帖还提到，@hexoai 已开源发布 SIA，目标是通过递归自我改进完成任意目标。

#开源#智能体#基准测试

阅读原始全文