返回日报列表
AI 日报 收录 9 条重要资讯

AI HOT 日报 (evening)

时间范围: 2026年05月20日 04:00 ~ 2026年05月20日 10:00
生成于: 2026年05月20日 10:00
本期导读
本期最重要的是 Google AI Studio 的移动端与 Android 开发能力更新,以及 Gemini 3.5 Flash 在第三方平台的定价和性能披露。基础设施侧,Cerebras 继续把 Kimi K2.6 推到企业试点,并给出约 1,000 tokens/s 的跑分;同时 Google DeepMind 还被曝以约 1 亿美元招募 Contextual AI 团队。

Google I/O 2026

AI Studio 推出移动端

Google AI Studio

Google AI Studio 预告推出 mobile 应用,支持 Android 和 iOS,可在手机端用 Gemini 测试 prompts、创建和迭代 web apps,并与桌面端自动同步。FAQ 显示应用将在未来几周面向全球开放,当前可在 Google Play 预注册、在 App Store 预订。

AI Studio 支持 Android 开发

Google

Google 在 #GoogleIO 上宣布 Google AI Studio 现在支持原生 Android development,用户可通过一个 prompt 构建 Android 应用。该功能以 14 秒视频展示,原帖获得约 37 万次观看。

Gemini 3.5 Flash 上线

ZenMuxGoogle

ZenMux 上线并可免费体验 Google 的 Gemini 3.5 Flash,页面标注发布时间为 2026-05-19,支持 OpenAI Chat Completions、OpenAI Responses、Anthropic Messages 和 Google Gemini API。页面给出 1.05M 上下文、65.53K 最大输出,价格为输入 $1.5/百万 token、输出 $9/百万 token、缓存读取 $0.15/百万 token、网络搜索 $0.014/次,并称 Google Vertex 延迟 2.46s、吞吐量 80.2 tps、可用率 100.00%。

Gemini 3.5 Flash 榜单成绩

ZenMuxGoogle

ZenMux 页面还称 Gemini 3.5 Flash 在 MCP Atlas、Toolathlon、Finance Agent 等榜单拿到第一,MMMU-Pro 为 83.6%,CharXiv Reasoning 为 84.2%,并优于 Gemini 3.1 Pro。该披露补充了模型的第三方可用性、价格与评测数据。

模型与推理

Cerebras 跑通 Kimi K2.6

Cerebras

Cerebras 表示正在企业试点中运行 Kimi K2.6,这是一款约 1 万亿参数的模型。Cerebras 称其速度约为 1,000 tokens/s,并表示这是 Artificial Analysis 测得的最快前沿模型性能;另有转述称 Gemini Flash 低于 300 TPS。

Cerebras 再披露 Kimi K2.6

CerebrasClement Delangue

Cerebras 再次确认正在企业试点中运行 Kimi K2.6,模型规模为 1 万亿参数,速度约 1,000 tokens/s。相关转述补充称这被标为 Artificial Analysis 测得的最快 frontier model 性能,同时对比 Gemini Flash 低于 300 TPS。

平台与智能体

Multica 管理 Agent 团队

Multica

Multica 推出开源项目管理平台,将编码智能体纳入类似 Trello 的看板与任务流中统一管理。平台支持 Claude Code、Codex CLI、Gemini CLI、OpenCode、OpenClaw、Kimi、Kiro CLI、Copilot、Hermes、Pi 等 11 款工具,并支持自动扫描本机工具、WebSocket 实时推送、桌面端与自托管部署。

Code as Agent Harness 综述

Xuying NingarXiv

Xuying Ning、Katherine Tieu、Dongqi Fu 等人发布综述《Code as Agent Harness: Toward Executable, Verifiable, and Stateful Agent Systems》,并同步维护配套仓库。论文聚焦 code-centric agentic systems 与 harness engineering,分为 Harness Interface、Harness Mechanisms、Scaling the Harness 三层,arXiv 编号为 2605.18747,仓库当前有 76 stars、2 forks。

Anthropic 讨论 frontier AI 品格

Anthropic

Anthropic 于 2026-05-19 发布文章,称其正在与来自 15+ 个宗教和跨文化群体的学者、神职人员、哲学家、伦理学者和公民思想者对话,讨论 frontier AI 的“品格形成”。公司还在探索 self-reminder 工具,让 Claude 在执行重要动作前暂停并调用自身承诺,内部测试显示可降低不一致行为。

基础设施

DeepMind 招募 Contextual AI

Douwe KielaBloomberg

据 Bloomberg 报道,Google DeepMind 已达成一项约 1 亿美元的交易,将从 Contextual AI 招募 20 多名研究人员,其中包括 CEO Douwe Kiela,并获得其技术授权。该消息来自 Techmeme 引用原帖,原文未披露更多交易结构或时间细节。