AI HOT 日报 (morning)
Google 发布
Gemini 3.5 Flash 上线
Google 于 2026年5月19日发布 Gemini 3.5 Flash,面向 agentic workflows 与 coding,已在 Gemini app、Google Search AI Mode、Antigravity、Gemini API、Google AI Studio 和 Android Studio 全球开放;官方称其在 Terminal-Bench 2.1 为 76.2%,GDPval-AA 为 1656 Elo,tokens/s 为同类 frontier 模型 4 倍。
Gemini Omni 发布
Google DeepMind 发布 Gemini Omni Flash,主打“from anything create anything”的视频生成与编辑,支持文本、图片、音频、视频组合输入,并已上线 Gemini app、Google Flow 和 YouTube Shorts;后续将开放 image、audio 等更多输出模态。
Antigravity 2.0 推出
Google 发布 Antigravity 2.0,作为面向 agent-first 时代的独立桌面应用,用于并行编排多个 agents,并同步提供 CLI、SDK 和 IDE 形态;演示中还展示了在 12 小时内用 93 个并行 sub-agents、15k+ 次请求和 2.6B tokens 构建可运行系统。
Search 默认切换 Flash
Google 将 Search 的 AI Mode 默认模型升级为 Gemini 3.5 Flash,并称其在几乎所有基准上超过 Gemini 3.1 Pro、速度快 4 倍;同时披露 AI Mode 一年内月活已超过 10 亿,Search 查询量上季度创历史新高。
Gemini 3.5 Pro 将至
Google DeepMind 发布 Gemini 3.5 系列后确认 3.5 Pro 已在内部使用,计划下个月推出;当前首发的 3.5 Flash 已覆盖 Gemini app、Search AI Mode、Antigravity、Gemini API、AI Studio、Android Studio 与 Gemini Enterprise。
Gemini App 改版
Google 宣布 Gemini 应用与网页端采用全新 Neural Expressive 设计,已在 web、Android 和 iOS 全球上线;同时强化即时回答、内联 Gemini Live、交互式图片/时间线/视频展示,以及模板化的图片、视频和音乐生成入口。
Google AI 订阅重构
Google I/O 期间调整 Google AI 订阅方案,将 Ultra 价格从 250 美元/月下调到 200 美元/月,并新增 100 美元/月档位;Ultra 方案包含 Antigravity、Gemini 3.5 Flash、20TB 存储和更高额度的 Gemini 使用量。
Gemini Omni Flash 开放
Google 宣布 Gemini Omni Flash 开始逐步上线,全球 Google AI Plus、Pro、Ultra 用户可先在 Gemini App 和 Flow 中使用,本周也将免费登陆 YouTube Shorts 和 YouTube Create,开发者与企业 API 访问将于数周后开放。
Gemini for Science 发布
Google DeepMind 发布 Gemini for Science 实验性工具,提供基于 Co-Scientist 的假设生成与基于 AlphaEvolve 的计算发现能力,可用多智能体辩论生成研究想法,并并行评分数千种代码变体以加速科学建模。
企业智能体
Claude 增加私有沙箱
Anthropic 为 Claude Managed Agents 推出 self-hosted sandboxes 公测和 MCP tunnels 研究预览,允许代理在用户自有基础设施或受控云环境中运行,并通过私有网络访问内部 MCP 服务器,强化企业级隔离与合规部署。
OpenAI 推出容量锁定
OpenAI 发布 Guaranteed Capacity,向企业提供 1-3 年锁定 compute 的方案,用于关键产品、agents 和工作流;Sam Altman 表示该计划仅开放到当前额度售罄为止,同时会为 ChatGPT、Codex 保留足够容量。
OpenRouter 上线搜索工具
OpenRouter 新增 openrouter:web_search 与 openrouter:web_fetch 两个 server-side 工具,支持模型在请求中自主决定搜索次数与抓取行为;Web Search 提供 Auto、Native、Exa、Parallel 四种引擎,价格最低 $0.005/次。
OpenAI 强化内容溯源
OpenAI 为图片内容增加 C2PA Content Credentials 与 SynthID 水印,并提供公开验证工具,用于检查图片是否由 OpenAI 产品生成;方案适用于 ChatGPT、OpenAI API 和 Codex,未来还将扩展跨平台验证。
Cloudflare 接入 Claude
Cloudflare 与 Anthropic 宣布将 Claude Managed Agents 集成到 Cloudflare Sandboxes,支持在微型虚拟机或 isolates 中执行代理、注入零信任凭证、访问私有服务并增强可观测性,面向企业安全与合规场景。
Claude 开放沙箱预览
Anthropic 在 Code with Claude London 活动中发布 self-hosted sandboxes 公测与 MCP tunnels 研究预览,允许 Claude Managed Agents 在用户自有或托管环境运行,并通过安全边界内的网络访问私有 MCP 服务。
Anthropic 收购 Stainless
Anthropic 收购长期为其生成官方 SDK、CLI 和 MCP server 的 Stainless,后者可将 API 规格生成 TypeScript、Python、Go、Java、Kotlin 等多语言客户端,进一步内化开发者体验与工具链能力。
NVIDIA 推自研通用 CPU
NVIDIA 开始向 Anthropic、OpenAI、SpaceX 和 Oracle Cloud 交付首款自研通用 CPU Vera,定位于 agentic AI 场景的高并发调度与工具调用,显示其基础设施版图从 GPU 向异构计算栈扩展。
OpenAI 强化溯源机制
OpenAI 进一步说明其图像溯源方案将同时使用 C2PA Content Credentials 与 SynthID 水印,并提供公开验证工具;该机制首先覆盖 ChatGPT、Codex 与 OpenAI API 生成的图像,未来计划支持跨行业验证。
模型与研究
Cursor 发布 Composer 2.5
Cursor 发布 Composer 2.5,基于 Moonshot 开源底座 Kimi K2.5,并通过 textual feedback RL、复杂 RL 环境与 25 倍合成任务规模提升长任务持续工作和指令遵循;官方还称其性价比显著优于同级模型。
Intern-S2-Preview 开源
上海 AI Lab 开源 Intern-S2-Preview,一个 35B 科学多模态模型,采用 Apache 2.0 许可;官方称其在科学、多模态、数学与 coding agent 等基准上可匹配万亿参数级 Intern-S1-Pro。
CNA 定位神经元行为
Nous Research 发布 Contrastive Neuron Attribution(CNA),可通过对比提示对定位并消融稀疏 MLP 神经元电路,无需训练 SAE 或改权重;在 8 个 instruct-tuned 模型上验证后,jailbreak benchmark 的 refusal rates 可下降 50% 以上。
Carbon DNA 模型发布
Hugging Face Bio 发布 DNA 建模模型 Carbon,称其比下一最佳模型快 275 倍,并可在单张 GPU 上少于 2 天处理完整人类基因组;核心做法是面向 DNA 序列的专用 tokenizer 与单碱基分辨率保持。
Qwen3.7 Preview 入 Arena
Qwen 团队将 Qwen3.7 Preview 接入 Arena,Text Arena 中 Qwen3.7 Max Preview 排名第 13、Alibaba 文本榜升至第 6,Vision Arena 中 Qwen3.7 Plus Preview 排名第 16、Alibaba 升至第 5,显示新系列在文本与视觉评测上具备竞争力。
Nemotron-Labs-Diffusion 开源
NVIDIA 发布 Nemotron-Labs-Diffusion,提供 3B、8B、14B 三个规模,可通过切换 attention pattern/mask 在 Autoregressive、Diffusion 和 Self-Speculation 三种解码方式间切换;官方称单用户真实吞吐最高可提升 4 倍并已开源。
MiniCPM-V 4.6 上线
OpenBMB 发布 MiniCPM-V 4.6,主打端侧高效多模态能力,在多项基准上超过 Gemma4-E2B-it 和 Qwen3.5-0.8B,且仅用后者 2.5% 的 token 预算;模型已开源并支持主流推理栈与移动端部署。
SenseNova 视觉模型上线
SenseNova-U1-8B-MoT-Infographic 已在 ModelScope 上线,面向海报、图表和复杂排版场景,支持 100+ 风格与布局;在 BizGenEval 和 IGenBench 上较 base 模型分别提升 6.8/4.3 和 18.2/12.8 分。
基础设施
llama.cpp 加速 Qwen3.6
llama.cpp 新增 Qwen3.6 家族的 MTP 支持后,本地推理吞吐在 DGX Spark 上由约 7 tok/s 提升到 13.9–21.6 tok/s,在 A10G 上 Qwen3.6-27B 从 25 tok/s 提升到 45 tok/s,显示本地推理效率继续提升。
LongLive 2.0 开源
NVlabs 开源 LongLive 2.0,提供长视频生成基础设施代码、论文、Demo 与模型权重,支持 NVFP4、sequence parallel、async decoding 与 infinite video generation,官方推理速度为 45.7 FPS。
Android CLI 升级 1.0
Google 发布 Android CLI 稳定版 1.0,新增 android studio 命令,使 AI Agent 可连接 Android Studio Quail 预览版并使用静态分析、重构、依赖管理与设备流式能力,面向 agentic development。
Antigravity CLI 发布
Google Antigravity 团队发布 Antigravity CLI,可在终端直接调用、监控和交互 agents,与 Antigravity 2.0 共享同一 agent harness,并支持将 CLI 中的对话导入桌面端。
Google AI Studio 导出 Antigravity
Google AI Studio 新增一键导出到 Antigravity 的能力,开发者可将原型项目直接迁移到 Antigravity 做规模化开发;同时 AI Studio 还支持原生 Android 开发。
Rerun 展示机械臂交互
Rerun 在官网加入实时跟随鼠标的机械臂交互,展示其 Physical AI 数据层能力;其仓库用于记录、查询和可视化机器人多模态数据,并提供 Python、Rust、C++ SDK。
OpenRouter 增加网页工具
OpenRouter 进一步说明其 web_search 与 web_fetch 工具已支持模型自主决定何时搜索、搜什么及搜索次数,并提供 allowed_domains、blocked_domains、max_content_tokens 等控制参数;旧 web plugin 正迁移为 tools 形式。
Google Flow 新增三项更新
Google 为 Flow 推出 Gemini Omni Flash、Google Flow Agent 和 Google Flow Tools 三项更新,强化面向创作者的规划、编辑和自然语言工作流搭建能力。
Vercel 教程接入 Claude
Vercel 发布教程,展示如何用 Vercel Sandbox 作为执行层构建 Claude Managed Agents 的 self-hosted environment,涉及 microVM、webhook 启动与 run_shell/read_file 等工具调用。
行业融资
Viktor 融资 7500 万
Zeta Labs 的 AI coworker Viktor 完成 7500 万美元 Series A,由 Accel 领投;官方称其上线 10 周即达 1500 万美元 ARR,并已被 12,000+ 团队或 13,000+ workspaces 使用。
Lucius 融资 300 万
Lucius AI 完成 300 万美元融资,定位为“组织的 Context Layer”,试图解决团队重复重建上下文的问题;团队称组织中超过 30% 的时间被用于重复获取与传递上下文。
Kosmos 进入药研生产
Edison Scientific 在 Incyte 完整研发管线中部署 Kosmos,属于生产系统而非试点;单次运行可读取 1,500 篇论文并生成 42,000 行代码,宣称结论可复现性达到 79%。