AI HOT 日报 (morning)
产品更新
Apple Siri 将整合 Google Gemini 模型
苹果计划在 WWDC 2026 上基于 Google Gemini 大模型重构 Siri 系统,通过混合本地 3B 参数模型与 Gemini 级云端模型,实现个性化 AI 代理平台,并整合隐私控制及智能照片编辑、影像识别等新功能。
OpenAI ChatGPT 将迎最大规模改版
英国金融时报报道,OpenAI 计划对 ChatGPT 进行自推出以来最大规模的改版,将其转型为集成编码工具和 AI 代理的“超级应用”,并新增盈利功能。新版本将兼具代码生成与智能体自动化操作能力,计划将 Codex 并入 ChatGPT。
Notion AI 暂停 Anthropic Opus 模型
Notion Status 宣布,因 Anthropic Opus 4.7 和 4.8 性能下降导致失败率升高,Notion AI 已在模型选择器中禁用所有 Anthropic 模型。请求将重路由至其他提供商,以确保大部分用户服务不受影响,但 Anthropic 专属功能暂时不可用。
模型发布
Meta 发布 Llama 3 8B 模型
Meta 发布 Llama 3 大模型,参数量为 80 亿。该版本性能比 Llama 2 提升 20%,计划于 2024 年第三季度上线。
DeepSeek V4 刷新形式化定理证明基准
DeepSeek V4 在形式化定理证明中实现 500 倍成本优势并刷新基准纪录,展示了其在高效推理和复杂逻辑任务上的显著能力提升。
商业与人事
Supabase 完成 5 亿美元 F 轮融资
Supabase 宣布完成 5 亿美元 F 轮融资,公司估值达到 100 亿美元,较一年前的 20 亿美元大幅增长。
Emergent 公司 6 个月达 1 亿美元 ARR
Emergent 公司在 6 个月内实现 1 亿美元的年经常性收入(ARR),覆盖 190 个国家和 850 万用户,并完成了三次架构重写。
Thoughtworks:Coding Agent 开发成本飙升
Thoughtworks 分析指出,Coding Agent 范式转移导致 AI 开发成本从 0.12 美分飙升至年均近 9 万美元,凸显了新兴 AI 开发模式带来的显著成本变化。
政策与安全
Elon Musk 警示 AI 脱离人类共同目标风险
Elon Musk 强调当前主流 AI 发展存在系统性风险:超级智能可能致命化地脱离人类利益,AI 利益与人类对立,AGI 应有益而非进攻性。此观点与 DeepMind 等专家对对齐问题的乐观态度形成对比,揭示了业界在 AI 监管方向的关键分歧。
白宫关注 OpenAI 公共财富基金方案
Financial Times 报道,Sam Altman 访问国会山后,白宫内部关注一种“主权财富基金式”方案,要求 AI 公司捐少量股权入基金,收益通过个人账户或分红回馈美国民众,以分享 AI 增长红利。
研究突破
论文:后训练推理数据应记录任务与行为
arXiv 论文《A Primer in Post-Training Reasoning Data: What They Know About How It Works》指出,推理数据不应仅为问答对,而需记录任务、模型行为、检查信号和来源元数据,并按可核验方式分类。强调 agent 数据应保留失败动作、重试等,作为主要学习信号。
OpenAI 推理模型破解 Erdős 数学难题
OpenAI 推理模型通过 test-time compute 方法,成功破解了著名的 Erdős 数学难题,展示了其在复杂数学推理方面的强大能力。
开发者工具
Claude Design 结合 Cursor 优化 App 开发流
研究人员开发了 Claude Design 的本地化实现方案,结合 Cursor 和 Opus 4.8 构建 App 开发工作流。Opus 4.8 在 UI 实现上比 GPT 更贴合设计稿,通过迭代优化 MVP。
Chrome DevTools 助 MCP 工具降 Token 消耗
Chrome DevTools 为多模态协同规划(MCP)工具提供四支柱支持,包括 Token 消耗量化、自愈错误信息、API Schema 标注及三层信任边界,旨在降低 Token 消耗并提升开发效率。
OpenAI 内部 Codex 项目百万行代码提效
OpenAI 内部 Codex 驱动的项目已生成 100 万行代码,效率提升约 10 倍,展现了 AI 在内部开发流程中的强大生产力。
基础设施
SpaceX 与 Google 云合作含 11 万块 NVIDIA GPU
SpaceX 与 Google 签署的 AI 云服务协议中,Google 将从 2026年10月 至 2029年6月,每月向 SpaceX 支付 9.2 亿美元(年化约 110 亿美元)用于 AI 计算资源,其中包含 11 万块 NVIDIA GPU。双方均可提前 90 天终止协议。