AI HOT 日报 (morning)
模型发布与更新
Anthropic 发布 Claude Fable 5 与 Mythos 5
Anthropic 同时发布 Claude Fable 5 (面向公众) 和 Mythos 5 (面向网络安全合作伙伴),两者共享同一底层模型。Fable 5 采用降级而非拒答的安全机制,遇敏感请求时路由至 Opus 4.8,触发率低于 5%。API 定价为每百万输入 Token 10 美元、输出 50 美元,相比 Mythos Preview 便宜 60%,但高于 Opus 4.8 和 GPT-5.5。模型在 APEX‑SWE 基准测试中 Pass@1 达 65.5% (领先 Opus 4.8 18%),SWE-Bench Pro 达 80.3% (领先 GPT-5.5 21.7%),GDPval-AA 取得 1932 分位列第一, exploit 测试成功率达 88.4% (显著高于 Opus 4.8 的 8.8%),具备 1M token 上下文窗口和 50M 行 Ruby 代码单日迁移能力。Anthropic 强制保留所有 Mythos 级别模型流量 30 天用于安全监控。
Google 发布 Gemini 3.5 Live Translate
Google 发布 Gemini 3.5 Live Translate,一款支持 70 多种语言的实时流式语音到语音翻译音频模型。该模型能在原说话者仍在讲话时开始翻译输出,将延迟保持在几秒内,并能保留语调、节奏和音高,确保对话流畅自然。该能力将逐步开放到 Gemini Live API、AI Studio、Google Translate (Android/iOS 版),并即将登陆 Google Meet 企业预览。
Cohere 开源 North Mini Code 模型
Cohere 发布并开源 North Mini Code 模型,这是一个 30B 总参数 (3B 激活参数) 的 MoE 纯文本代码模型,采用 Apache 2.0 许可证,专为 agentic coding 优化。在 Artificial Analysis Intelligence Index 上得分 27.6,Coding Index 上达 33.4,显示出在同等规模模型中的竞争力。该模型在非编码智能体任务上表现较弱,GDPval-AA 14%,但在 Cohere API 上输出速度达约 199 tokens/s。
ZhipuAI 发布角色动画模型 SCAIL-2
ZhipuAI 在 ModelScope 发布角色动画模型 SCAIL-2,支持参考图驱动的动作迁移和原生长视频生成。该模型能够处理翻转、遮挡和多角色交互等复杂动作,通过 3D 姿态控制保持深度与空间关系,并提供 ComfyUI 工作流支持,采用 Apache 2.0 协议开源。
MiMo V2.5 Pro UltraSpeed 模型发布,速度达 1000 Tokens/s
MiMo 发布 MiMo V2.5 Pro UltraSpeed 模型,实现每秒超过 1,000 Token 的输出速度,声称是首款达到此速度的万亿参数模型。在三个测试场景中,性能达到 804-1426 Token/s,首次响应时间为 0.83-4.71 秒,相比其他超高速方案,在不牺牲模型能力的前提下实现显著速度提升。
Apple 发布 200 亿参数 AFM 3 Core Advanced 模型
Apple 与 Google 合作发布五款基础模型,其中 AFM 3 Core Advanced 拥有 200 亿参数,完全在设备上运行,通过闪存存储并仅加载 1-40 亿参数的专家子集。其他模型从设备端延伸至私有云,最复杂的云模型在 NVIDIA GPU 上运行,进一步细化了 Apple 在其生态系统中整合 AI 的策略。
商业与人事
OpenAI 提交保密 S-1 文件,启动上市程序
OpenAI 官方博客确认已提交 confidential S-1 文件,正式启动上市的法律和监管程序,但尚未决定 IPO 具体时间,并可能长期保持私有状态。此举依据《Securities Act of 1933》Rule 135,旨在保留未来上市灵活性,但目前不构成出售或购买证券的要约。此公告紧随 Anthropic 提交保密 IPO 文件之后,表明头部 AI 公司正加速资本布局,为下一代 AI 基础设施融资。
NVIDIA 获得生成式 AI 领域最新融资
NVIDIA 公司通过最新一轮融资成功获得大量资金,旨在加速其在生成式 AI 领域的发展。具体金额未明确,但此笔融资被描述为与 AI 产业相关技术发展发布的重大商业事件。
研究与技术突破
Microsoft Research 发布 Mirage,提升视频生成速度
Microsoft Research 推出 Mirage,利用潜在空间记忆将 3D 场景直接存储为 latent tokens,跳过 RGB 渲染-重编码循环。此方法使视频生成速度提升最高 10.57 倍,内存占用降低 55 倍,并在 WorldScore 上达到 SOTA 级别的一致性,大幅提高了 3D 视频生成的效率和质量。
VLA-JEPA 世界模型优化动作检索提升训练效率
在 VLA-JEPA 中,研究人员通过优化动作检索机制,显著提升了世界模型的训练效率。这一关键改进点使得模型能更有效地学习和预测动态环境中的行为,是机器人领域的一项初步技术突破。
AI 更精准匹配细胞治疗方案研究发表于 Nature Methods
Project Ex Vivo 在 Nature Methods 发表研究,指出 AI 模型从多样化细胞状态中学到的内容,超过单纯扩充数据集带来的收益。这项研究强调 AI 在精准匹配个体细胞治疗方案、改善癌症药物疗效方面的潜力,并为人类工具需求战略规划提供了参考。
人类机器人领域方法已正式公开
人类机器人领域的一项初步方法已正式公开,标志着该领域研究的进一步透明化和发展。该方法涵盖了机器人技术的核心原理和应用方向,旨在推动人机协作的深入探索。
开发者工具与基准
Cognition 发布 FrontierCode 编码基准
Cognition 推出 FrontierCode 基准,用于评估 AI 编程能力,尤其关注代码是否达到“可合并”的高质量标准。该评测集包含 150 个任务,来自 36 个旗舰开源仓库,经过 1000+ 小时维护者验证,并设有 3000+ 条评分细则。评测分为 Extended、Main、Diamond 三层,结果显示 Opus 4.8 在难度最高的 Diamond 上仅得 13.4%,GPT-5.5 6.3%,Gemini 3.1 Pro 4.7%,最佳开源 Kimi K2.6 3.8%。
Kimi Code 大幅升级:CLI 安装、视频上下文与插件系统
Moonshot AI 开源的 Kimi Code 迎来重大升级,支持通过单行 CLI 命令快速安装和零配置启动。新版本引入视频作为编码上下文输入能力,可将参考视频或屏幕录像转换为可运行代码。此外,Kimi Code 上线了插件系统,支持股票价格、财报、学术论文等一键获取功能,并通过 ACP 协议兼容 JetBrains 和 Zed 等 IDE,同时提供自定义 hooks 扩展工作流。
Kocoro 开源 Agent 引擎实现 macOS 跨日记忆
Kocoro 开源 Agent 引擎,通过 TensorLogic 训练的轻量级记忆模型,在 macOS 端实现了跨日历记忆功能。该引擎能持续保存日常工作会话(包括项目状态、工具使用记录和多应用交互操作)至本地,提供 CLI 和 GUI 两种使用方式。其开源核心模块 (shan runtime) 支持可视化审计和可配置控制,并通过视频演示展现了跨应用任务连续执行能力。
产品更新
LumaLabs Ray 3.2 集成 Figma Weave
LumaLabs 发布 Ray 3.2,新功能可直接在 Figma Weave 中生成内容,无需本地处理。此更新旨在简化设计流程,提升设计师在 Figma 环境中的内容创作效率。