返回精选
AI 精选动态 智能评分 62

OpenAI Codex Record & Replay 功能上线

来源: twitter关注列表
作者: ginobefun (@hongming731)
发布于: 2026-06-18
收录于: 2026-06-18
AI 推荐理由
新增演示即复用的工作流自动化方式,值得关注并跟进后续平台支持情况
核心解读
OpenAI 为 Codex 推出 Record & Replay 功能,用户只需演示一次完整浏览器操作(如在 YouTube Studio 填写元数据、上传缩略图、保存私密视频),系统即把录制转化为可复用技能,可在后续任务中自动匹配素材、填写信息、核验结果,支持电脑、浏览器及已连接插件操作,未来可扩展至 PR 整理、日程安排等场景。
全文
BestBlogs 早报 · 06-19 # OpenAI Codex / Claude Code Artifacts / A2A 协议 / Record & Replay / FoldRun [1] ★ 精讲|OpenAI Codex Record & Replay:演示一次,即可复用浏览器工作流 [视频] OpenAI 为 Codex 上线 Record & Replay:用户只需演示一次完整操作(如在 YouTube Studio 填写元数据、上传缩略图、保存私密视频),Codex 就能把这次录制转化为可复用技能,在新任务里自主匹配素材、填写信息、核验结果。能力覆盖电脑操作、浏览器操作和已连接插件,未来还能扩展到整理 PR、安排日程等场景——把「写提示词」换成了「做一次示范」。 来源:OpenAI https://t.co/um4wlFlaaL [2] ★ 精讲|Claude Code 现已支持 Artifacts 渲染功能 Claude Code 上线 Artifacts 功能:会话过程能被实时转化成可分享的可视化页面——PR 走查、系统说明、仪表盘、发布清单等,且随工作推进自动更新同一链接。基于会话上下文(代码库、连接器、对话本身)直接生成,无需额外搭建数据源。团队调试场景验证最多:工程师把故障排查过程发布成时间线、可疑提交和错误曲线,站会前已迭代两次,所有人对齐同一视图。目前 Beta 阶段面向 Team/Enterprise 组织开放。 来源:Claude Blog https://t.co/1CKZiBfE3i [3] ★ 精讲|A2A 如何构建一个协作智能体的世界 Google 的智能体协作协议 A2A 满周岁:相比把智能体当 API 调用,A2A 让智能体之间发起真正的协作——保护内部「秘方」逻辑不外泄、避免单一智能体上下文被海量依赖污染、支持智能体反馈不完整请求并追问。文章以蛋白质结构预测工具 FoldRun 为例:开发者只需把任务交给 FoldRun 这个独立智能体节点,无需自建 GPU 流水线和模型生命周期管理。A2A 的 Python/Go SDK 已 1.0 GA,正拓展到电商支付、企业数据流和跨平台运维场景。 来源:Google Developers Blog https://t.co/acCuEFDqsV [4] 哪条路线,才能通往「世界模型」的终局?|对话黄碧薇:Aether AI 创始人 [播客] 黄碧薇教授深度拆解世界模型的技术现状,提出以因果 AI 为核心的第四条路线,分享了因果世界模型如何让机器人真正理解物理规律并实现举一反三,以及她从学者到创业者的心路历程。 来源:十字路口 Crossing https://t.co/fJAzJc4hzd [5] 你的 Harness 工作流真的在进步吗?我们用一场考试撕掉了遮羞布 本文提出一套面向 Harness 工作流的可量化、可回归、闭环的评测体系,通过「出题-答题-改卷」的考试机制,解决工作流效果无法客观评估的问题。 来源:腾讯技术工程 https://t.co/oJYNieNYGb [6] 超越流水线的 CI/CD:Robert Erez 谈渐进式交付、GitOps 与前滚恢复 [视频] Robert Erez 将 CI/CD 从流水线检查清单提升为一套务实的风险管理方法,其核心包括渐进式交付、实用主义 GitOps、前滚恢复以及规范的功能开关治理。 来源:The Pragmatic Engineer https://t.co/AFXgaV12TA [7] 从开源到 Agent,从组织到个体:AIEC 大会现场侧记 [播客] 两位资深行业观察者在 AIEC 大会现场,深度复盘了 AI 领域从模型、Agent 到组织变革的核心共识与非共识,并探讨了技术洪流下个体的价值与定位。 来源:屠龙之术 https://t.co/qk9AHGdUhG [8] MosaicLeaks:你的研究智能体还能保守秘密吗? MosaicLeaks 引入了一个基准测试和一种隐私感知的强化学习方法(PA-DR),表明深度研究智能体会通过网页查询中的马赛克效应泄露隐私信息,并且仅针对任务性能进行训练会使泄露问题更加严重。 来源:Hugging Face - Blog https://t.co/jdSZCcxYlp [9] 智能体化程度够了吗?用自有工具对开源模型进行基准测试 本文介绍了一种基准测试框架,它不仅衡量智能体是否成功完成任务,还衡量其付出的工作量,并以 `transformers` 库为例,展示了新的 CLI 和 Skill 能帮助大型开源模型,但会损害小型模型。 来源:Hugging Face - Blog https://t.co/DBAOFFNSbN [10] TPU 上的 MoE 推理优化:SGLang-JAX 用 Pallas 内核砍延迟 53% 本文详细介绍了在 TPU v7x 上优化服务 Ling-2.6-1T MoE 模型的过程,重点是一种新颖的 Pallas 内核(Fused MoE V2),它将数据移动隐藏在计算之后,实现了 MoE 预填充延迟降低 53%,并在解码吞吐量上最高达到 H200 GPU 的 1.77 倍。 来源:LMSYS Blog https://t.co/bbst1iRcip --- https://t.co/88ZBr47sdT · 发现真正适合你的高质量内容 BestBlogs 是 AI 驱动的私人阅读助手,帮助你建立稳定、可信、个性化的高质量信息输入。 关注你感兴趣的来源和主题,每天生成一份更适合自己的「我的早报」。 在线阅读:https://t.co/ukha2zkMGh > **引用原帖 ginobefun (@hongming731):** > https://t.co/UXtwz1t6mz > https://x.com/hongming731/status/2067749918719316228
#技术更新#产品发布#智能体