AI HOT 日报 (evening)
Google I/O 2026
AI Studio 推出移动端
Google AI Studio 预告推出 mobile 应用,支持 Android 和 iOS,可在手机端用 Gemini 测试 prompts、创建和迭代 web apps,并与桌面端自动同步。FAQ 显示应用将在未来几周面向全球开放,当前可在 Google Play 预注册、在 App Store 预订。
AI Studio 支持 Android 开发
Google 在 #GoogleIO 上宣布 Google AI Studio 现在支持原生 Android development,用户可通过一个 prompt 构建 Android 应用。该功能以 14 秒视频展示,原帖获得约 37 万次观看。
Gemini 3.5 Flash 上线
ZenMux 上线并可免费体验 Google 的 Gemini 3.5 Flash,页面标注发布时间为 2026-05-19,支持 OpenAI Chat Completions、OpenAI Responses、Anthropic Messages 和 Google Gemini API。页面给出 1.05M 上下文、65.53K 最大输出,价格为输入 $1.5/百万 token、输出 $9/百万 token、缓存读取 $0.15/百万 token、网络搜索 $0.014/次,并称 Google Vertex 延迟 2.46s、吞吐量 80.2 tps、可用率 100.00%。
Gemini 3.5 Flash 榜单成绩
ZenMux 页面还称 Gemini 3.5 Flash 在 MCP Atlas、Toolathlon、Finance Agent 等榜单拿到第一,MMMU-Pro 为 83.6%,CharXiv Reasoning 为 84.2%,并优于 Gemini 3.1 Pro。该披露补充了模型的第三方可用性、价格与评测数据。
模型与推理
Cerebras 跑通 Kimi K2.6
Cerebras 表示正在企业试点中运行 Kimi K2.6,这是一款约 1 万亿参数的模型。Cerebras 称其速度约为 1,000 tokens/s,并表示这是 Artificial Analysis 测得的最快前沿模型性能;另有转述称 Gemini Flash 低于 300 TPS。
Cerebras 再披露 Kimi K2.6
Cerebras 再次确认正在企业试点中运行 Kimi K2.6,模型规模为 1 万亿参数,速度约 1,000 tokens/s。相关转述补充称这被标为 Artificial Analysis 测得的最快 frontier model 性能,同时对比 Gemini Flash 低于 300 TPS。
平台与智能体
Multica 管理 Agent 团队
Multica 推出开源项目管理平台,将编码智能体纳入类似 Trello 的看板与任务流中统一管理。平台支持 Claude Code、Codex CLI、Gemini CLI、OpenCode、OpenClaw、Kimi、Kiro CLI、Copilot、Hermes、Pi 等 11 款工具,并支持自动扫描本机工具、WebSocket 实时推送、桌面端与自托管部署。
Code as Agent Harness 综述
Xuying Ning、Katherine Tieu、Dongqi Fu 等人发布综述《Code as Agent Harness: Toward Executable, Verifiable, and Stateful Agent Systems》,并同步维护配套仓库。论文聚焦 code-centric agentic systems 与 harness engineering,分为 Harness Interface、Harness Mechanisms、Scaling the Harness 三层,arXiv 编号为 2605.18747,仓库当前有 76 stars、2 forks。
Anthropic 讨论 frontier AI 品格
Anthropic 于 2026-05-19 发布文章,称其正在与来自 15+ 个宗教和跨文化群体的学者、神职人员、哲学家、伦理学者和公民思想者对话,讨论 frontier AI 的“品格形成”。公司还在探索 self-reminder 工具,让 Claude 在执行重要动作前暂停并调用自身承诺,内部测试显示可降低不一致行为。
基础设施
DeepMind 招募 Contextual AI
据 Bloomberg 报道,Google DeepMind 已达成一项约 1 亿美元的交易,将从 Contextual AI 招募 20 多名研究人员,其中包括 CEO Douwe Kiela,并获得其技术授权。该消息来自 Techmeme 引用原帖,原文未披露更多交易结构或时间细节。