AI HOT 日报 (noon)
基础设施
Azure 携 NVIDIA 创 MLPerf 训练纪录
Azure 与 NVIDIA 合作,在 NVIDIA Blackwell 平台上使用 8,192 块 GB200 NVL72 GPU 训练 Llama 3.1 405B 模型,仅用时 7.07 分钟,创下迄今最大、最快的 MLPerf Training 纪录,展现全栈协同创新。
Elon Musk 提月球 1000 太瓦 AI 算力方案
Elon Musk 在 Twitter Space 演讲中提出,通过在月球部署大质量驱冲系统,利用月球低重力环境电磁加速器发射 AI 卫星,实现 1000 太瓦级 AI 算力。方案强调 90% 部件需在月球本地生产以降低成本。
政策与安全
美商务部正式发函限制 Anthropic 模型出口
美国商务部长 Howard Lutnick 致函 Anthropic CEO Dario Amodei,宣布其模型因国家安全风险,需取得 BIS 出口许可证方可全球出口,包括向美国境内外国人提供访问(视为出口)。违规将面临民事和刑事处罚,禁令持续生效。
产品更新
微软 Copilot Cowork 全面上市,探讨 DeepSeek V4 集成
微软宣布 Copilot Cowork 正式向全球上市,并已支持多模型。微软正考虑将 Azure 托管的 DeepSeek V4 作为低成本模型选项,以支持企业基于私有知识进行长时间、复杂 Agent 任务。同时,行业正关注企业级 Agent 频繁调用可能导致的 token 消耗与计费模式的可持续性挑战。
OpenAI Codex 功能欧洲上线,含 Computer Use
OpenAI Developers 宣布,本周向欧洲经济区、英国和瑞士的用户推出 Codex 的新功能,包括 Computer Use、Codex Chrome 扩展、个性化记忆和 Chronicle 功能,进一步扩展其在欧洲市场的影响力。
Browser Use 文本编辑器推注释记录功能
Browser Use 为 ChatGPT Client 推出插件,提供对话履历持久化存储和段落注释功能。该方案通过本地化数据处理确保合规性,已于 2024 年 7 月 9 日发布,支持 ChatGPT 及符合条件的 OpenAI 模型,但当前仍存在调用依赖同步问题。
智能体与平台
Cursor 升级为 Agent 时代全端 Dev 平台
Cursor 在收购 Graphite 后,通过 Origin 项目将代码托管与 Git 平台功能整合进 AI 编辑器,目标是实现从代码写作到协作的全链路无缝体验,并计划于秋季发布。该平台旨在支持团队和 Agent 更好地协作管理代码。
Browser Use v4 代理系统实现游戏自主操作
Browser Use 的 v4 代理系统展示了分析获胜策略、创建反应性子代理的能力,并实现了对 powerline.io 游戏的自主操作。该系统展现了理解游戏状态和实时控制的潜力,用户正测试其是否能获得首位。
开发者工具
Codex 操控电脑的三种方式深度解析
Codex 团队成员 Jason 详细介绍了 Computer Use(跨应用控制但慢)、Chrome 扩展(利用登录状态协作)和内置浏览器(隔离环境适合前端开发)三种操控电脑方式,并给出了针对不同场景的选择建议。
Firecrawl 推出免费无门槛 API 抓取网页/PDF
Firecrawl 宣布推出免费试用模式,用户现在可通过 API 端点直接搜索网页、抓取内容并将 PDF 解析为 Markdown,无需注册或配置 API key,大幅降低了使用门槛。
PP-OCRv6 开源本地 OCR 工作台发布
Berryxia.AI 发布 PP-OCRv6 开源本地工作台,支持 1.5MB 到 34.5MB 三种模型规格,通过 CoreML 在 Mac、Intel、Linux 及浏览器端实现零依赖本地运行。该工作台还提供图片批量处理、多格式导出和跨平台评测脚本。
商业与人事
ChatGPT 市场份额首次跌破 50%
Sensor Tower 数据显示,ChatGPT 在 AI 助手市场份额首次跌破 50%,降至 46.4%,而 Gemini 和 Claude 分别占 27.7% 和 10.3%。尽管 ChatGPT 月活仍有 11 亿,但用户正在向其他平台迁移,整个市场预计在 2025 年下载量达 23 亿次,支出 42 亿美元,使用时长 360 亿小时,但增长已趋缓。