AI HOT 日报 (noon)

模型发布

Google 开源 DiffusionGemma

Googlegooglegemma

Google 发布实验性开源模型 DiffusionGemma，采用 26B MoE (3.8B 激活参数) 架构，量化后可在 18GB 显存运行。模型以并行方式一次性生成 256 token 文本块，在专用 GPU 上速度提升最高 4 倍（H100 达 1000+ token/s）。

ZhipuAI 发布 SCAIL-2 模型

ZhipuAIModelScope2022

ZhipuAI 在 ModelScope 发布角色动画模型 SCAIL-2，支持参考图驱动的动作迁移和原生长视频生成。该模型能够处理翻转、遮挡和多角色交互等复杂动作，通过 3D 姿态控制保持深度与空间关系，并提供 ComfyUI 工作流支持，采用 Apache 2.0 协议开源。

MiMo 发布 V2.5 Pro UltraSpeed

MiMoTileRT_AI

MiMo 发布 V2.5 Pro UltraSpeed 模型，实现每秒超 1,000 Token 输出，是首款达此速度的万亿参数 MoE 模型。实测性能达 804-1426 Token/s，首次响应 0.83-4.71s，API 版宣称 3 倍价格获 10 倍体验提升。

Apple 发布 AFM 3 Core Advanced

AppleGoogle

Apple 与 Google 合作发布五款基础模型，其中 AFM 3 Core Advanced 拥有 200 亿参数，完全在设备上运行，通过闪存存储并仅加载 1-40 亿参数的专家子集，进一步细化了 Apple 在其生态系统中整合 AI 的策略。

智能体与平台

AI Agent 提升知识工作效率

PerplexityHarvard Business School

Perplexity 与 Harvard Business School 研究显示，Agent 使知识工作任务平均耗时从 269 分钟降至 36 分钟（节省 87%），综合成本下降 94%。在编程场景中，时间从 596 分钟降至 48 分钟，成本下降 96%，用户中断率约 3.7%。

Nex-N2-Pro 模型 ModelScope 上线

ModelScope2022Nex AGI

ModelScope 开源 Nex-N2-Pro 397B 大模型并上线推理 API 服务，基准测试指标显著提升，Terminal-Bench 2.1 达 75.3、SWE-Bench Verified 达 80.8、BrowseComp 83.7、GDPval 1585。采用 SGLang fork 等自定义部署架构，Apache 2.0 许可证。

Jina v5 Omni 本地多模态搜索

Jina AIHan Xiao

Jina AI CEO Han Xiao 演示 jina-v5-omni 嵌入模型构建的本地全模态文件搜索系统，支持文本、PDF、图像、音频和视频的离线索引。系统采用 Swift 原生界面，在 M3/M4 Pro/Ultra 设备运行无 OOM，通过本地 HTTP 服务为智能体提供索引访问。

Google DeepMind 研究 AI 助教

Google DeepMind

Google DeepMind 在塞拉利昂研究 AI 作为教师协作伙伴，以应对学生增长快于教师供给的挑战。8 周观察显示，学生使用 Gemini 理解概念的查询占比从 68% 升至 90%，展现 AI 在教育领域的辅助潜力。

产品更新

Claude Fable 5 制作零剪辑视频

trq212shao__meng

Claude Code 核心开发者 @trq212 利用 Claude Fable 5，通过提示指令调度 ElevenLabs、Whisper、FFmpeg 等工具，在不使用传统编辑软件的情况下，完成 4K、3 分钟、4334 帧、653 MB 的 Launch 视频制作。项目以 JSON 编辑决策列表保存。

Claude Code UI 存在缺陷

SemiAnalysis_

SemiAnalysis 指出 Claude Code UI 存在功能缺陷及稳定性问题，影响用户体验和开发效率。报告详细分析了具体 Bug 表现，并提出改进建议，引起了开发者社区对 AI 编程工具可用性的关注。

Cohere Transcribe 登顶榜单

Coherenickfrosst

Cohere 宣布其开源语音识别模型 Cohere Transcribe (Apache 2.0 协议) 在 Hugging Face Far-Field ASR benchmark 上排名第 1，展示了领先的性能和识别准确率。

Google Search 将推 Antigravity

Googlermstein

Google 在 Google I/O 上演示，搜索将在未来几个月内为美国的 Google AI Pro 与 Ultra 订阅用户提供 Antigravity 功能。该功能可在搜索页面内创建类似小程序的自定义体验，用于婚礼策划、搬家管理等持续任务。

LumaLabs Ray 3.2 集成 Figma

LumaLabsFigma Weave

LumaLabs 发布 Ray 3.2，新功能可直接在 Figma Weave 中生成内容，无需本地处理。此更新旨在简化设计流程，提升设计师在 Figma 环境中的内容创作效率和工作流顺畅性。

开发者工具

小米开源 MiMo-Code 编码助手

MiMoOpenCodeberryxia

小米发布开源终端AI编码助手 MiMo-Code，团队在 14 天内基于 OpenCode 框架开发，并与 MiMo-V2.5 模型深度集成。它具备 SQLite 持久记忆、三类子代理、自动检查点等功能，MIT 协议开源，通过 curl 一键安装。

Gemini API 部署 agent 深度分析

Google Developers

该内容详细介绍了使用 Gemini 3.5 Flash 与 Antigravity 技术，实现代码驱动的 Agent 开发流程。强调其无需服务器管理即可自动化任务，通过 GitHub 存储或 Google Cloud 托管可快速集成，提供简洁入门路径。

Text-To-Lottie 开源工具发布

konstipaulusshao__meng

开源作者 @konstipaulus 发布 Text-To-Lottie，一个让 Agent 生成可渲染 Lottie 的开源 Skill 与本地预览 Harness 组合，支持 Agent 输出标准 Bodymovin JSON。通过 Skia CanvasKit 实时热重载预览，并提供 5 条 Prompt 指南。

Kimi Code 大幅升级

Kimi DevelopersMoonshot AI

Moonshot AI 开源的 Kimi Code 迎来重大升级，支持通过单行 CLI 命令快速安装和零配置启动。新版本引入视频作为编码上下文输入能力，可将参考视频或屏幕录像转换为可运行代码，并上线了插件系统。

Kocoro 开源 Agent 引擎

Kocororohanpaul_ai

Kocoro 开源 Agent 引擎，通过 TensorLogic 训练的轻量级记忆模型，在 macOS 端实现了跨日历记忆功能。该引擎能持续保存日常工作会话，提供 CLI 和 GUI 两种使用方式，其开源核心模块支持可视化审计和可配置控制。

研究突破

人类在AI领域的角色分析

thdxr

该篇分析了人类在AI领域的潜力与实践中的关键权衡，探讨了未来发展中人类与AI的协作模式及各自扮演的角色，旨在为从业者提供关于人类在AI生态系统价值贡献的深度思考。

Cohere North Mini Code 深度解析

Cohereshao__meng

Cohere 开源编程模型 North Mini Code (30B/3B MoE)，采用 128 专家、256K 输入/64K 输出上下文，最低需 1× H100。SWE-Bench Verified pass@10 达 80.2%，Terminal-Bench v2 pass@10 达 55.1%，RL 后 Terminal pass@1 提升 7.9%。

谷歌 Agent 编码模型效率提升

Google Researchthdxr

谷歌研究团队提出基于 OpenCode 增强的 Agent 编码模型，通过文件系统模糊匹配与 OpenCode 实时代码提取，解决了 Agent 处理大型代码库时的效率问题。实测显示模型在 SinkBench 和 APPS 基准测试中的通过率提升 58%。

Claude Fable 令牌消耗分析

Anthropicemollick

一篇技术博客通过实测数据揭示了 Anthropic Claude 模型在 Fable 工作流中快速消耗令牌的特性。分析了模型交互模式的关键特征，这对于优化成本和效率至关重要，提醒开发者注意令牌消耗。

Microsoft Mirage 提升视频生成

Microsoft ResearchHuggingPapers

Microsoft Research 推出 Mirage，利用潜在空间记忆将 3D 场景直接存储为 latent tokens，跳过 RGB 渲染循环。该方法使视频生成速度提升最高 10.57 倍，内存占用降低 55 倍，并在 WorldScore 上达到 SOTA 级别的一致性。

VLA-JEPA 世界模型效率优化

LeRobotHF

在 VLA-JEPA 中，研究人员通过优化动作检索机制，显著提升了世界模型的训练效率。这一关键改进使得模型能更有效地学习和预测动态环境中的行为，是机器人领域的一项初步技术突破。

AI 匹配细胞治疗方案

Project Ex VivoNature Methods

Project Ex Vivo 在 Nature Methods 发表研究，指出 AI 模型从多样化细胞状态中学到的内容，超过单纯扩充数据集带来的收益。这项研究强调 AI 在精准匹配个体细胞治疗方案、改善癌症药物疗效方面的潜力。

商业与人事

AI订阅比API划算 40-70倍

SemiAnalysis_rohanpaul_ai

SemiAnalysis 研究显示，对高强度 coding/chat 用户，Anthropic 和 OpenAI 的 AI 订阅（如 $200/月的 ChatGPT Pro）比按 API 付费便宜 40–70 倍。ChatGPT Pro 可提供 $14,000/月的 API 等价用量，Claude Max 20x 约 $8,000/月。

Satya Nadella 重述微软 AI 战略

Satya Nadellagokulr

微软 CEO Satya Nadella 在 Build 2026 访谈中提出 AI 战略九大支柱，包括生态系统优先、重构 IDE 以支持并发代理会话、哈尼斯成核心产品、私有评测为核心 IP、代理轨迹可入资产负债表等。微软将自身定位为评测与哈尼斯公司。

中国拟推 2950 亿美元 AI 计划

ReutersBloomberg News

路透援引 Bloomberg News 报道，中国正准备一项规模约 2950 亿美元的国家级 AI 基础设施计划，拟整合数据中心、电信运营商和国产芯片为一个由国家支持的算力网络，并计划依赖本土供应商，至少 80% 的技术来自国内。

PoeticHQ 获 5000 万美元融资

PoeticHQmarkiewagner

PoeticHQ 发布一套声称可执行数小时复杂任务且准确率达 99%+ 的 AI 系统，比 agents 少用 10 倍 token。公司同时宣布完成 5000 万美元融资，估值 5 亿美元，一年内从零增长到八位数年化收入。

TownAI 完成 5500 万美元融资

TownAIa16z

TownAI 宣布在 a16z 主导的 Series A 轮融资中获得 5500 万美元，投资方包括 First Round 等。该 AI 助手通过集成邮箱、日历、Slack 等，主动提出工作流、调度、跟进等任务，声称能更好地理解用户需求。

Nathan Lambert 兼职 Arcee AI

Nathan LambertArcee AI

Nathan Lambert 加入 Arcee AI 担任研发顾问，此任命由 Arcee 官方公布，强调其在开源模型生态中的关键作用，旨在支持美国开源软件运动。此举标志着 Arcee 在加强生态合作的战略调整。

OpenAI 提交保密 S-1 文件

OpenAIWSJ

OpenAI 官方博客确认已提交 confidential S-1 文件，正式启动上市的法律和监管程序，但尚未决定 IPO 具体时间，并可能长期保持私有状态。此举依据《Securities Act of 1933》Rule 135，旨在保留未来上市灵活性。