AI HOT 日报 (noon)
商业与人事
Google 工程教育团队被裁撤
Google 工程教育团队近日被裁撤,该团队负责培训 10 万+ 工程师,并维护自 2006 年起的“Testing on the Toilet”工程文化内容。此举被解读为 Google 可能不再系统性投入工程师培养。
腾讯探讨 AI 下半场战略与 Agent 性能
腾讯高级执行副总裁汤道生与首席 AI 科学家姚顺雨对谈,讨论 AI 从“解决问题”转向“定义问题”、模型与产品Co-Design及Agent演进策略。Hy3 preview 在 CodeBuddy 与 WorkBuddy 上首 token 延迟降低 54%,可驱动最长 495 步复杂 Agent 工作流。
模型发布
Alibaba 发布 Qwen3.7-Plus 模型
Alibaba 推出闭源模型 Qwen3.7-Plus,支持文本、视频和图像输入。该模型定价为每 100 万 tokens 输入 0.4 美元,输出 1.6 美元。
Google Gemma 4 QAT 检查点更新细节
Google 发布 Gemma 4 Quantization-Aware Training (QAT) 检查点,将最小模型体积从 11.4GB 压缩至 1.1GB,文本专用版仅 0.84GB。QAT 在训练期间模拟压缩以保持推理质量,并为移动端实现静态激活、通道量化、2位量化及KV缓存优化,降低手机端计算负担。
智能体与平台
Agent Arena 发布最新排行榜
Arena.ai 更新 Agent Arena 实时排行榜,基于百万级用户在线会话评估 Agent 表现。当前前 5 名是 GPT-5.5 (High)、Claude Opus 4.7 (Thinking)、GLM-5.1、Gemini-3.1-Pro、Kimi-K2.6。评估统计任务成功率、用户反馈、可引导性、bash错误恢复和工具幻觉等 5 个信号。
开发者工具
Han Xiao 发布本地多模态搜索工具
Han Xiao 发布 beta 版本地多模态文件搜索工具,在 Mac 上可离线、全本地索引 text、PDF、image、audio 和 video。该工具采用 Swift-native UI 和 mlx-swift-transformer 优化,不使用 Python,并在 M 系列芯片上运行流畅,提供本地 HTTP server 供 Agent 访问。
政策与安全
OpenAI Custodial CDR v2.0 上线
OpenAI Developers 发布 Custodial CDR v2.0,集成了更先进的意图检测与防盗救援功能,用户显示界面简洁。该更新补足了模型版本及许可协议方面的显著差距。