返回精选
AI 精选动态 智能评分 74

微软发布终端原生 Web Agent 框架 Webwright

来源: twitter关注列表
作者: meng shao (@shao__meng)
发布于: 2026-05-27
收录于: 2026-05-27
AI 推荐理由
这条内容同时给出了可复用的终端式架构、跨后端支持和多个基准上的具体提升,适合关注浏览器自动化与 Agent 工程化落地的人直接看原文。
核心解读
微软发布终端原生 Web Agent 框架 Webwright,核心思路是让 LLM 直接生成可运行的 Playwright 脚本,把网页操作从“观察→预测点击→执行”改为代码驱动。该框架工作区本地保存脚本、截图和日志,浏览器会话可重建,核心循环约 1000 行代码,依赖 httpx、pydantic、playwright、typer,并支持 OpenAI、Anthropic、OpenRouter 后端。性能上,Webwright 在 Online-Mind2Web 300 个任务上达到 86.7%(GPT-5.4),在同类开源框架中最高;在 Odysseys 200 个长程任务、平均 76.1 步的评测中达到 60.1%(GPT-5.4),比此前 SOTA 高 15.6 个百分点,比基线 GPT-5.4 高 26.6 个百分点;Claude Opus 4.7 在该框架上达到 84.7%,难例 80.5%,难例表现超过 GPT-5.4。
#开发者工具#智能体#开源