返回日报列表
AI 日报 收录 100 条重要资讯

AI HOT 日报 (morning)

时间范围: 2026年05月19日 00:00 ~ 2026年05月20日 00:00
生成于: 2026年05月19日 21:57
本期导读
本时段最核心的主题是 Google I/O 2026 级别的集中发布:Gemini 3.5 Flash、Gemini Omni、Antigravity 2.0 与一系列 Search/Flow/CLI/Studio 更新,明显把竞争重心推向 agentic workflows、开发者平台与多模态生成。另一条主线是企业级智能体基础设施快速成形,Anthropic、OpenAI、OpenRouter、Cloudflare 等围绕私有沙箱、MCP 连接、内容溯源和 server-side tools 持续补齐生产化能力。

Google 发布

Gemini 3.5 Flash 上线

GoogleGoogleDeepMindGoogleAIStudio

Google 于 2026年5月19日发布 Gemini 3.5 Flash,面向 agentic workflows 与 coding,已在 Gemini app、Google Search AI Mode、Antigravity、Gemini API、Google AI Studio 和 Android Studio 全球开放;官方称其在 Terminal-Bench 2.1 为 76.2%,GDPval-AA 为 1656 Elo,tokens/s 为同类 frontier 模型 4 倍。

Gemini Omni 发布

GoogleDeepMindGoogleAI

Google DeepMind 发布 Gemini Omni Flash,主打“from anything create anything”的视频生成与编辑,支持文本、图片、音频、视频组合输入,并已上线 Gemini app、Google Flow 和 YouTube Shorts;后续将开放 image、audio 等更多输出模态。

Antigravity 2.0 推出

GoogleGoogleDeepMind

Google 发布 Antigravity 2.0,作为面向 agent-first 时代的独立桌面应用,用于并行编排多个 agents,并同步提供 CLI、SDK 和 IDE 形态;演示中还展示了在 12 小时内用 93 个并行 sub-agents、15k+ 次请求和 2.6B tokens 构建可运行系统。

Search 默认切换 Flash

GoogleSundar Pichai

Google 将 Search 的 AI Mode 默认模型升级为 Gemini 3.5 Flash,并称其在几乎所有基准上超过 Gemini 3.1 Pro、速度快 4 倍;同时披露 AI Mode 一年内月活已超过 10 亿,Search 查询量上季度创历史新高。

Gemini 3.5 Pro 将至

GoogleDeepMindJeff Dean

Google DeepMind 发布 Gemini 3.5 系列后确认 3.5 Pro 已在内部使用,计划下个月推出;当前首发的 3.5 Flash 已覆盖 Gemini app、Search AI Mode、Antigravity、Gemini API、AI Studio、Android Studio 与 Gemini Enterprise。

Gemini App 改版

GeminiAppGoogle

Google 宣布 Gemini 应用与网页端采用全新 Neural Expressive 设计,已在 web、Android 和 iOS 全球上线;同时强化即时回答、内联 Gemini Live、交互式图片/时间线/视频展示,以及模板化的图片、视频和音乐生成入口。

Google AI 订阅重构

GoogleGeminiApp

Google I/O 期间调整 Google AI 订阅方案,将 Ultra 价格从 250 美元/月下调到 200 美元/月,并新增 100 美元/月档位;Ultra 方案包含 Antigravity、Gemini 3.5 Flash、20TB 存储和更高额度的 Gemini 使用量。

Gemini Omni Flash 开放

GoogleGoogleAI

Google 宣布 Gemini Omni Flash 开始逐步上线,全球 Google AI Plus、Pro、Ultra 用户可先在 Gemini App 和 Flow 中使用,本周也将免费登陆 YouTube Shorts 和 YouTube Create,开发者与企业 API 访问将于数周后开放。

Gemini for Science 发布

GoogleDeepMind

Google DeepMind 发布 Gemini for Science 实验性工具,提供基于 Co-Scientist 的假设生成与基于 AlphaEvolve 的计算发现能力,可用多智能体辩论生成研究想法,并并行评分数千种代码变体以加速科学建模。

企业智能体

Claude 增加私有沙箱

AnthropicClaudeDevs

Anthropic 为 Claude Managed Agents 推出 self-hosted sandboxes 公测和 MCP tunnels 研究预览,允许代理在用户自有基础设施或受控云环境中运行,并通过私有网络访问内部 MCP 服务器,强化企业级隔离与合规部署。

OpenAI 推出容量锁定

OpenAIsama

OpenAI 发布 Guaranteed Capacity,向企业提供 1-3 年锁定 compute 的方案,用于关键产品、agents 和工作流;Sam Altman 表示该计划仅开放到当前额度售罄为止,同时会为 ChatGPT、Codex 保留足够容量。

OpenRouter 上线搜索工具

OpenRouter

OpenRouter 新增 openrouter:web_search 与 openrouter:web_fetch 两个 server-side 工具,支持模型在请求中自主决定搜索次数与抓取行为;Web Search 提供 Auto、Native、Exa、Parallel 四种引擎,价格最低 $0.005/次。

OpenAI 强化内容溯源

OpenAIGoogleDeepMind

OpenAI 为图片内容增加 C2PA Content Credentials 与 SynthID 水印,并提供公开验证工具,用于检查图片是否由 OpenAI 产品生成;方案适用于 ChatGPT、OpenAI API 和 Codex,未来还将扩展跨平台验证。

Cloudflare 接入 Claude

CloudflareAnthropic

Cloudflare 与 Anthropic 宣布将 Claude Managed Agents 集成到 Cloudflare Sandboxes,支持在微型虚拟机或 isolates 中执行代理、注入零信任凭证、访问私有服务并增强可观测性,面向企业安全与合规场景。

Claude 开放沙箱预览

AnthropicClaudeDevs

Anthropic 在 Code with Claude London 活动中发布 self-hosted sandboxes 公测与 MCP tunnels 研究预览,允许 Claude Managed Agents 在用户自有或托管环境运行,并通过安全边界内的网络访问私有 MCP 服务。

Anthropic 收购 Stainless

AnthropicStainless

Anthropic 收购长期为其生成官方 SDK、CLI 和 MCP server 的 Stainless,后者可将 API 规格生成 TypeScript、Python、Go、Java、Kotlin 等多语言客户端,进一步内化开发者体验与工具链能力。

NVIDIA 推自研通用 CPU

NVIDIA

NVIDIA 开始向 Anthropic、OpenAI、SpaceX 和 Oracle Cloud 交付首款自研通用 CPU Vera,定位于 agentic AI 场景的高并发调度与工具调用,显示其基础设施版图从 GPU 向异构计算栈扩展。

OpenAI 强化溯源机制

OpenAI

OpenAI 进一步说明其图像溯源方案将同时使用 C2PA Content Credentials 与 SynthID 水印,并提供公开验证工具;该机制首先覆盖 ChatGPT、Codex 与 OpenAI API 生成的图像,未来计划支持跨行业验证。

模型与研究

Cursor 发布 Composer 2.5

CursorMoonshot

Cursor 发布 Composer 2.5,基于 Moonshot 开源底座 Kimi K2.5,并通过 textual feedback RL、复杂 RL 环境与 25 倍合成任务规模提升长任务持续工作和指令遵循;官方还称其性价比显著优于同级模型。

Intern-S2-Preview 开源

上海AI LabModelScope

上海 AI Lab 开源 Intern-S2-Preview,一个 35B 科学多模态模型,采用 Apache 2.0 许可;官方称其在科学、多模态、数学与 coding agent 等基准上可匹配万亿参数级 Intern-S1-Pro。

CNA 定位神经元行为

Nous Research

Nous Research 发布 Contrastive Neuron Attribution(CNA),可通过对比提示对定位并消融稀疏 MLP 神经元电路,无需训练 SAE 或改权重;在 8 个 instruct-tuned 模型上验证后,jailbreak benchmark 的 refusal rates 可下降 50% 以上。

Carbon DNA 模型发布

Hugging Face

Hugging Face Bio 发布 DNA 建模模型 Carbon,称其比下一最佳模型快 275 倍,并可在单张 GPU 上少于 2 天处理完整人类基因组;核心做法是面向 DNA 序列的专用 tokenizer 与单碱基分辨率保持。

Qwen3.7 Preview 入 Arena

Alibaba CloudQwen

Qwen 团队将 Qwen3.7 Preview 接入 Arena,Text Arena 中 Qwen3.7 Max Preview 排名第 13、Alibaba 文本榜升至第 6,Vision Arena 中 Qwen3.7 Plus Preview 排名第 16、Alibaba 升至第 5,显示新系列在文本与视觉评测上具备竞争力。

Nemotron-Labs-Diffusion 开源

NVIDIAHugging Face

NVIDIA 发布 Nemotron-Labs-Diffusion,提供 3B、8B、14B 三个规模,可通过切换 attention pattern/mask 在 Autoregressive、Diffusion 和 Self-Speculation 三种解码方式间切换;官方称单用户真实吞吐最高可提升 4 倍并已开源。

MiniCPM-V 4.6 上线

OpenBMBHugging Face

OpenBMB 发布 MiniCPM-V 4.6,主打端侧高效多模态能力,在多项基准上超过 Gemma4-E2B-it 和 Qwen3.5-0.8B,且仅用后者 2.5% 的 token 预算;模型已开源并支持主流推理栈与移动端部署。

SenseNova 视觉模型上线

ModelScopeSenseTime

SenseNova-U1-8B-MoT-Infographic 已在 ModelScope 上线,面向海报、图表和复杂排版场景,支持 100+ 风格与布局;在 BizGenEval 和 IGenBench 上较 base 模型分别提升 6.8/4.3 和 18.2/12.8 分。

基础设施

llama.cpp 加速 Qwen3.6

llama.cppggerganov

llama.cpp 新增 Qwen3.6 家族的 MTP 支持后,本地推理吞吐在 DGX Spark 上由约 7 tok/s 提升到 13.9–21.6 tok/s,在 A10G 上 Qwen3.6-27B 从 25 tok/s 提升到 45 tok/s,显示本地推理效率继续提升。

LongLive 2.0 开源

NVlabs

NVlabs 开源 LongLive 2.0,提供长视频生成基础设施代码、论文、Demo 与模型权重,支持 NVFP4、sequence parallel、async decoding 与 infinite video generation,官方推理速度为 45.7 FPS。

Android CLI 升级 1.0

GoogleAndroidDev

Google 发布 Android CLI 稳定版 1.0,新增 android studio 命令,使 AI Agent 可连接 Android Studio Quail 预览版并使用静态分析、重构、依赖管理与设备流式能力,面向 agentic development。

Antigravity CLI 发布

Googleantigravity

Google Antigravity 团队发布 Antigravity CLI,可在终端直接调用、监控和交互 agents,与 Antigravity 2.0 共享同一 agent harness,并支持将 CLI 中的对话导入桌面端。

Google AI Studio 导出 Antigravity

Google

Google AI Studio 新增一键导出到 Antigravity 的能力,开发者可将原型项目直接迁移到 Antigravity 做规模化开发;同时 AI Studio 还支持原生 Android 开发。

Rerun 展示机械臂交互

Rerun

Rerun 在官网加入实时跟随鼠标的机械臂交互,展示其 Physical AI 数据层能力;其仓库用于记录、查询和可视化机器人多模态数据,并提供 Python、Rust、C++ SDK。

OpenRouter 增加网页工具

OpenRouter

OpenRouter 进一步说明其 web_search 与 web_fetch 工具已支持模型自主决定何时搜索、搜什么及搜索次数,并提供 allowed_domains、blocked_domains、max_content_tokens 等控制参数;旧 web plugin 正迁移为 tools 形式。

Google Flow 新增三项更新

Google

Google 为 Flow 推出 Gemini Omni Flash、Google Flow Agent 和 Google Flow Tools 三项更新,强化面向创作者的规划、编辑和自然语言工作流搭建能力。

Vercel 教程接入 Claude

VercelAnthropic

Vercel 发布教程,展示如何用 Vercel Sandbox 作为执行层构建 Claude Managed Agents 的 self-hosted environment,涉及 microVM、webhook 启动与 run_shell/read_file 等工具调用。

行业融资

Viktor 融资 7500 万

Zeta LabsAccel

Zeta Labs 的 AI coworker Viktor 完成 7500 万美元 Series A,由 Accel 领投;官方称其上线 10 周即达 1500 万美元 ARR,并已被 12,000+ 团队或 13,000+ workspaces 使用。

Lucius 融资 300 万

Lucius AIFuture Capital

Lucius AI 完成 300 万美元融资,定位为“组织的 Context Layer”,试图解决团队重复重建上下文的问题;团队称组织中超过 30% 的时间被用于重复获取与传递上下文。

Kosmos 进入药研生产

Edison ScientificIncyte

Edison Scientific 在 Incyte 完整研发管线中部署 Kosmos,属于生产系统而非试点;单次运行可读取 1,500 篇论文并生成 42,000 行代码,宣称结论可复现性达到 79%。