AI 日报
收录 6 条重要资讯
AI HOT 日报 (evening)
本期导读
本时段,AI 开发者工具领域迎来重要进展,Grok Build 升级为功能完备的终端原生代理工作区,提升了工作流和插件管理能力。模型方面,Tongyi 发布豆包实时语音模型3.0 API,支持全双工对话和实时工具调用;Zhipu AI 的 GLM-5.2 在移动开发基准测试中任务完成数大幅提升。此外,DeepSeek 研究员开源 AutoResearch 协议,推动自主研究代理在 RL 闭环中实现零人工干预。模型发布
豆包实时语音模型3.0 API 上线
Tongyi 公司发布豆包实时语音模型3.0 API,升级支持全双工对话(同时听说)和端到端语音处理。关键功能包括自定义规则指导(如管理多人对话参与时机)和实时工具调用能力(如预定日历、发邮件),相比上一代新增跨场景交互能力。
GLM-5.2 移动开发能力大幅提升
Zhipu AI 的 GLM-5.2 模型在移动开发基准测试中表现显著,任务完成数从 21/70 提升至 48/70,实现两倍以上增长。该性能已接近 Claude Fable 5 的 56/70,展示了其在移动开发领域的竞争力。
开发者工具
Grok Build 更新日志:Agent 工作区升级
Grok Build 从编码 CLI 进化为终端原生代理工作区,新增计划/审查/批准工作流、项目感知上下文、技能、插件、MCP 服务器及并行子代理等功能。最新升级支持渲染层对数学公式、LaTeX、Mermaid 等图表的直接显示,并提供 Agent Dashboard 与 Plugin Marketplace,显著提升了长上下文处理和系统可靠性。
研究突破
DeepSeek 研究员开源 AutoResearch 协议
DeepSeek 研究员 Deli Chen 开源 AutoResearch 协议并发布 Self-play 综述。该协议使代理能在 DeepSeek 285B 模型上首次完全自主运行完整的 RL 研究闭环(实验设计、代码编写、GPU 任务提交、调试、结论总结),实现零人工干预。