AI HOT 日报 (evening)
模型与平台
OpenAI GPT-5.6 延期,Codex 5.6 成用户留存策略
OpenAI 团队的 GPT-5.6 模型未能及时推出,转而依靠多次重置 Codex 5.6 额度以维持用户留存率。尽管此举缓解了短缺问题,但该策略直接反映了 OpenAI 在商业功能优化和管理规划上的考量。
Apodex 1.0:深度研究自进化系统性能超SOTA
Apodex 1.0 深度研究代理系统发布,包含 150 个子代理,支持 15,000 步并行探索,内置三层自我验证机制。在 BrowseComp 获 90.3 分(超越 GPT-5.5-pro),DeepSearchQA 获 94.4 分(超越 Claude-Opus-4.8 和 Kimi-K2.6),并在 FrontierScience-Olympiad 获 87.4 分,FutureX 竞赛包揽前四名。该系统通过可审计证据链增强报告准确性,采用 Apache 2.0 许可。
Xenova 发布 Gemma 4 WebGPU 优化 Demo:Fable 5 内核提速
Xenova 发布了 Fable 5 为 Google Gemma 4 模型编写的自定义 WebGPU kernels 演示,实现 WebGPU 推理速度从 84 tok/s 显著提升至 255 tok/s。该优化采用 agentic kernel optimization,被认为是端侧推理的未来方向。
商业与洞察
Google Gemini 联席负责人 Noam Shazeer 离职加入 OpenAI
Google Gemini 联合负责人 Noam Shazeer 离职加入 OpenAI。Google 曾于 2024 年花费 27 亿美元将其与 Character.AI 团队签回负责 Gemini 项目。他的加入将为 OpenAI 带来对话系统构建经验、Google 规模基础设施经验以及对架构竞争的深入理解。
Vivek Nair:AI 研究工具导致“假忙碌”现象
Berryxia.AI 转载 Vivek Nair 文章,指出 AI 工具降低研究门槛,导致研究者陷入“假装忙碌”,忽视目标导向的原创性思维。文章获 520 万阅读,提出自主选题、阅读原文、记录反思、专注失败的四步反制方法,警示 2026 年的研究者。
TechCrunch 分析 AI 版本演进与性能提升
TechCrunch 对最新 AI 版本演进进行分析,强调了与上一代技术的差异对比,提炼了版本号、参数量和具体数据。报告突出了功能改进,并与 SOTA 进行对比,详细阐述了性能提升和实际应用场景。