AI HOT 日报 (noon)
模型发布
Google 开源 DiffusionGemma
Google 发布实验性开源模型 DiffusionGemma,采用 26B MoE (3.8B 激活参数) 架构,量化后可在 18GB 显存运行。模型以并行方式一次性生成 256 token 文本块,在专用 GPU 上速度提升最高 4 倍(H100 达 1000+ token/s)。
ZhipuAI 发布 SCAIL-2 模型
ZhipuAI 在 ModelScope 发布角色动画模型 SCAIL-2,支持参考图驱动的动作迁移和原生长视频生成。该模型能够处理翻转、遮挡和多角色交互等复杂动作,通过 3D 姿态控制保持深度与空间关系,并提供 ComfyUI 工作流支持,采用 Apache 2.0 协议开源。
MiMo 发布 V2.5 Pro UltraSpeed
MiMo 发布 V2.5 Pro UltraSpeed 模型,实现每秒超 1,000 Token 输出,是首款达此速度的万亿参数 MoE 模型。实测性能达 804-1426 Token/s,首次响应 0.83-4.71s,API 版宣称 3 倍价格获 10 倍体验提升。
Apple 发布 AFM 3 Core Advanced
Apple 与 Google 合作发布五款基础模型,其中 AFM 3 Core Advanced 拥有 200 亿参数,完全在设备上运行,通过闪存存储并仅加载 1-40 亿参数的专家子集,进一步细化了 Apple 在其生态系统中整合 AI 的策略。
智能体与平台
AI Agent 提升知识工作效率
Perplexity 与 Harvard Business School 研究显示,Agent 使知识工作任务平均耗时从 269 分钟降至 36 分钟(节省 87%),综合成本下降 94%。在编程场景中,时间从 596 分钟降至 48 分钟,成本下降 96%,用户中断率约 3.7%。
Nex-N2-Pro 模型 ModelScope 上线
ModelScope 开源 Nex-N2-Pro 397B 大模型并上线推理 API 服务,基准测试指标显著提升,Terminal-Bench 2.1 达 75.3、SWE-Bench Verified 达 80.8、BrowseComp 83.7、GDPval 1585。采用 SGLang fork 等自定义部署架构,Apache 2.0 许可证。
Jina v5 Omni 本地多模态搜索
Jina AI CEO Han Xiao 演示 jina-v5-omni 嵌入模型构建的本地全模态文件搜索系统,支持文本、PDF、图像、音频和视频的离线索引。系统采用 Swift 原生界面,在 M3/M4 Pro/Ultra 设备运行无 OOM,通过本地 HTTP 服务为智能体提供索引访问。
Google DeepMind 研究 AI 助教
Google DeepMind 在塞拉利昂研究 AI 作为教师协作伙伴,以应对学生增长快于教师供给的挑战。8 周观察显示,学生使用 Gemini 理解概念的查询占比从 68% 升至 90%,展现 AI 在教育领域的辅助潜力。
产品更新
Claude Fable 5 制作零剪辑视频
Claude Code 核心开发者 @trq212 利用 Claude Fable 5,通过提示指令调度 ElevenLabs、Whisper、FFmpeg 等工具,在不使用传统编辑软件的情况下,完成 4K、3 分钟、4334 帧、653 MB 的 Launch 视频制作。项目以 JSON 编辑决策列表保存。
Claude Code UI 存在缺陷
SemiAnalysis 指出 Claude Code UI 存在功能缺陷及稳定性问题,影响用户体验和开发效率。报告详细分析了具体 Bug 表现,并提出改进建议,引起了开发者社区对 AI 编程工具可用性的关注。
Cohere Transcribe 登顶榜单
Cohere 宣布其开源语音识别模型 Cohere Transcribe (Apache 2.0 协议) 在 Hugging Face Far-Field ASR benchmark 上排名第 1,展示了领先的性能和识别准确率。
Google Search 将推 Antigravity
Google 在 Google I/O 上演示,搜索将在未来几个月内为美国的 Google AI Pro 与 Ultra 订阅用户提供 Antigravity 功能。该功能可在搜索页面内创建类似小程序的自定义体验,用于婚礼策划、搬家管理等持续任务。
LumaLabs Ray 3.2 集成 Figma
LumaLabs 发布 Ray 3.2,新功能可直接在 Figma Weave 中生成内容,无需本地处理。此更新旨在简化设计流程,提升设计师在 Figma 环境中的内容创作效率和工作流顺畅性。
开发者工具
小米开源 MiMo-Code 编码助手
小米发布开源终端AI编码助手 MiMo-Code,团队在 14 天内基于 OpenCode 框架开发,并与 MiMo-V2.5 模型深度集成。它具备 SQLite 持久记忆、三类子代理、自动检查点等功能,MIT 协议开源,通过 curl 一键安装。
Gemini API 部署 agent 深度分析
该内容详细介绍了使用 Gemini 3.5 Flash 与 Antigravity 技术,实现代码驱动的 Agent 开发流程。强调其无需服务器管理即可自动化任务,通过 GitHub 存储或 Google Cloud 托管可快速集成,提供简洁入门路径。
Text-To-Lottie 开源工具发布
开源作者 @konstipaulus 发布 Text-To-Lottie,一个让 Agent 生成可渲染 Lottie 的开源 Skill 与本地预览 Harness 组合,支持 Agent 输出标准 Bodymovin JSON。通过 Skia CanvasKit 实时热重载预览,并提供 5 条 Prompt 指南。
Kimi Code 大幅升级
Moonshot AI 开源的 Kimi Code 迎来重大升级,支持通过单行 CLI 命令快速安装和零配置启动。新版本引入视频作为编码上下文输入能力,可将参考视频或屏幕录像转换为可运行代码,并上线了插件系统。
Kocoro 开源 Agent 引擎
Kocoro 开源 Agent 引擎,通过 TensorLogic 训练的轻量级记忆模型,在 macOS 端实现了跨日历记忆功能。该引擎能持续保存日常工作会话,提供 CLI 和 GUI 两种使用方式,其开源核心模块支持可视化审计和可配置控制。
研究突破
人类在AI领域的角色分析
该篇分析了人类在AI领域的潜力与实践中的关键权衡,探讨了未来发展中人类与AI的协作模式及各自扮演的角色,旨在为从业者提供关于人类在AI生态系统价值贡献的深度思考。
Cohere North Mini Code 深度解析
Cohere 开源编程模型 North Mini Code (30B/3B MoE),采用 128 专家、256K 输入/64K 输出上下文,最低需 1× H100。SWE-Bench Verified pass@10 达 80.2%,Terminal-Bench v2 pass@10 达 55.1%,RL 后 Terminal pass@1 提升 7.9%。
谷歌 Agent 编码模型效率提升
谷歌研究团队提出基于 OpenCode 增强的 Agent 编码模型,通过文件系统模糊匹配与 OpenCode 实时代码提取,解决了 Agent 处理大型代码库时的效率问题。实测显示模型在 SinkBench 和 APPS 基准测试中的通过率提升 58%。
Claude Fable 令牌消耗分析
一篇技术博客通过实测数据揭示了 Anthropic Claude 模型在 Fable 工作流中快速消耗令牌的特性。分析了模型交互模式的关键特征,这对于优化成本和效率至关重要,提醒开发者注意令牌消耗。
Microsoft Mirage 提升视频生成
Microsoft Research 推出 Mirage,利用潜在空间记忆将 3D 场景直接存储为 latent tokens,跳过 RGB 渲染循环。该方法使视频生成速度提升最高 10.57 倍,内存占用降低 55 倍,并在 WorldScore 上达到 SOTA 级别的一致性。
VLA-JEPA 世界模型效率优化
在 VLA-JEPA 中,研究人员通过优化动作检索机制,显著提升了世界模型的训练效率。这一关键改进使得模型能更有效地学习和预测动态环境中的行为,是机器人领域的一项初步技术突破。
AI 匹配细胞治疗方案
Project Ex Vivo 在 Nature Methods 发表研究,指出 AI 模型从多样化细胞状态中学到的内容,超过单纯扩充数据集带来的收益。这项研究强调 AI 在精准匹配个体细胞治疗方案、改善癌症药物疗效方面的潜力。
商业与人事
AI订阅比API划算 40-70倍
SemiAnalysis 研究显示,对高强度 coding/chat 用户,Anthropic 和 OpenAI 的 AI 订阅(如 $200/月的 ChatGPT Pro)比按 API 付费便宜 40–70 倍。ChatGPT Pro 可提供 $14,000/月的 API 等价用量,Claude Max 20x 约 $8,000/月。
Satya Nadella 重述微软 AI 战略
微软 CEO Satya Nadella 在 Build 2026 访谈中提出 AI 战略九大支柱,包括生态系统优先、重构 IDE 以支持并发代理会话、哈尼斯成核心产品、私有评测为核心 IP、代理轨迹可入资产负债表等。微软将自身定位为评测与哈尼斯公司。
中国拟推 2950 亿美元 AI 计划
路透援引 Bloomberg News 报道,中国正准备一项规模约 2950 亿美元的国家级 AI 基础设施计划,拟整合数据中心、电信运营商和国产芯片为一个由国家支持的算力网络,并计划依赖本土供应商,至少 80% 的技术来自国内。
PoeticHQ 获 5000 万美元融资
PoeticHQ 发布一套声称可执行数小时复杂任务且准确率达 99%+ 的 AI 系统,比 agents 少用 10 倍 token。公司同时宣布完成 5000 万美元融资,估值 5 亿美元,一年内从零增长到八位数年化收入。
TownAI 完成 5500 万美元融资
TownAI 宣布在 a16z 主导的 Series A 轮融资中获得 5500 万美元,投资方包括 First Round 等。该 AI 助手通过集成邮箱、日历、Slack 等,主动提出工作流、调度、跟进等任务,声称能更好地理解用户需求。
Nathan Lambert 兼职 Arcee AI
Nathan Lambert 加入 Arcee AI 担任研发顾问,此任命由 Arcee 官方公布,强调其在开源模型生态中的关键作用,旨在支持美国开源软件运动。此举标志着 Arcee 在加强生态合作的战略调整。
OpenAI 提交保密 S-1 文件
OpenAI 官方博客确认已提交 confidential S-1 文件,正式启动上市的法律和监管程序,但尚未决定 IPO 具体时间,并可能长期保持私有状态。此举依据《Securities Act of 1933》Rule 135,旨在保留未来上市灵活性。
政策与安全
Anthropic CEO 提 AI 政策框架
Anthropic CEO Dario Amodei 发布《Policy on the AI Exponential》长文,呼吁紧急更新政策框架以适应 AI 进展速度。提议强制性预发布测试与独立审计,政府有权阻止高风险模型部署,并推出 15 亿美元资助早期科学家的国家研究计划。
中国大模型开发者安全观
资深 OpenAI 人员分析中美 AI 安全领域价值取向差异,指出中国企业在大模型开发中的安全意识与实践现状。结合 Anthropic 核心团队成员角色,重评其公司治理模式,提供具体案例分析及行业前瞻思考。
Replit 推出 Package Firewall
Replit 与 Socket 合作推出 Package Firewall,默认在 Replit Auto-Protect 中启用。该功能旨在恶意软件到达应用前拦截,已每日阻止约 8,000 次恶意安装,显著提升了开发环境的安全性。