AI HOT 日报 (evening)
NVIDIA GTC / Computex
Nemotron 3 Ultra 发布
NVIDIA 在 Jensen Huang 的 Computex 主题演讲中宣布 Nemotron 3 Ultra 模型,参数量 550B(其中 55B 活跃参数),是迄今最大的 Nemotron 3 模型,也是美国开源权重模型中智能指数最高的。该模型在 Artificial Analysis 智能指数中得分 48,领先于 Gemma 4 31B(39),但落后于 Kimi K2.6(54)。DeepInfra 推理速度可达每秒 300 个 token。
Alpamayo 2 Super 自动驾驶模型
NVIDIA 在 NVIDIAGTC 台北大会上发布 Alpamayo 2 Super,这是其迄今最强大的开源自动驾驶基础模型,参数规模达 320 亿,采用 reasoning VLA 架构,旨在帮助开发者构建安全可扩展的四级无人驾驶出租车,同时推出 AlpaGym、OmniDreams 和物理 AI 智能体技能等配套工具。
DSX 平台提供 AI 工厂方案
NVIDIA 推出 DSX 平台,整合电力、土地、并网、冷却、光模块、GPU、HBM、先进封装、晶圆代工、网络及云容量等资源,打造 AI 工厂的全栈解决方案。该平台被定位为智能时代的“重工业”,NeoCloud 被描述为新时代的“硅基”地产开发商。
Rubin NVL72 平台量产进展
NVIDIA Rubin NVL72 平台已启动晶圆级大规模生产,机架级仍处于工程样机阶段。Jensen Huang 宣布 Microsoft 已完成首个 Rubin VR200 NVL72 机架的启动。该平台搭载 72 个 Rubin GPU、36 个 Vera CPU,提供 3.6 exaFLOPS FP4 推理性能,已通过 L11 标准测试。
N1X Arm SoC 芯片发布
NVIDIA 推出 Arm 架构 SoC 芯片 N1X,性能超越 Intel/AMD 高端本,接近 MacBook Pro,但 Windows 系统支持存在局限性。
Vera BlueField-4 STX 安全存储
NVIDIA 在 Taipei 发布了新的 DOCA 安全创新,Vera BlueField-4 STX 提供更快的运行时威胁检测,支持高性能数据保护。
台积电采用 NVIDIA AI 技术
台积电采用 NVIDIA CUDA-X、Metropolis、TAO Toolkit、Omniverse 和 Cosmos 技术,加速芯片设计、优化晶圆厂操作和改进缺陷检测。
RTX Spark 超级芯片发布
NVIDIA 发布 RTX Spark 超级芯片,搭载 1-petaflop 性能,整合 CUDA 和 RTX 生态系统,支持 Windows 原生智能体,标志着个人计算机进入新发展阶段。
扩大 DRIVE Hyperion 自动驾驶生态
NVIDIA 宣布扩大 DRIVE Hyperion 生态系统,为全球 L4 级自动驾驶车队提供机器人出租车平台。HUMAIN、VinFast、Autobrains_AI 与 Uber 等伙伴将在东南亚、中东和欧洲推出基于 DRIVE Hyperion 的机器人出租车项目。该平台整合了 Halos、DRIVE AGX、DriveOS、多模态传感器套件和 DRIVE AV 软件。
Cosmos Coalition 联合开发世界模型
NVIDIA 与多个领先的 AI 实验室联合成立 Cosmos Coalition,共同开发和开源物理世界模型。Runway 作为创始成员参与,旨在通过开放生态加速世界模型研究。
开源物理 AI 智能体技能集
NVIDIA 在 NVIDIAGTC 大会上宣布推出物理 AI 智能体技能与工具的开源集合,整合 Omniverse 库、Cosmos 世界模型、Isaac 模拟框架等技术,覆盖自动驾驶、机器人、视觉 AI、工业数字孪生和医疗等领域。
NVIDIA 安全扫描数据集开源
NVIDIA 与 OpenClaw 合作开放了基于 67,453 条 ClawHub 技能的安全扫描数据集,标记 0.31% 为恶意,1/2 记录被标记为代理风险,不同扫描器对风险的同意率不超过 8.5%。数据集已在 Hugging Face 上发布供研究使用。
模型发布
MiniMax M3 开放权重模型发布
MiniMax 发布其首个开放权重多模态编码与智能体模型 M3,支持 100 万 token 上下文,采用 MiniMax Sparse Attention 架构,每 token 计算量仅为上一代的约 1/20。在 SWE-Bench Pro 达 59.0% (与 GPT-5.5 持平),Terminal Bench 2.1 达 66.0%,SWE-fficiency 34.8%,KernelBench Hard 28.8%,MCP Atlas 74.2%。模型已登陆 OpenRouter,输入/输出价格分别为 $0.6/$2.4 每百万 token,并享 50% 折扣。MiniMax Agent 具备持久记忆、可进化技能和统一计费功能。
PaddleOCR-VL-1.6 版发布
PaddlePaddle 发布了 PaddleOCR-VL-1.6,实现 96.33% 的准确率,超越了上一代模型,并在多个测试平台上取得新记录。该版本引入了区域优化框架,提升了表格、图表和古文字识别的精度。
智能体与应用
OpenClaw 发布 Hy-Memory 插件
OpenClaw 发布 Hy-Memory 插件,基于 6 层记忆框架和 System1/System2 双系统,宣称解决记忆碎片化,内存数量降低 70% 以上,信息密度提升 45% 以上,超长上下文 token 用量降低 35%,更新速度提升 20%。
Claude AI 逆向工程恢复报告
Claude AI 在 11 小时飞行中通过检查 Alfred Clipboard 数据库(SQLite 格式)逆向工程数据格式,绕过 24 小时删除政策,成功恢复用户丢失的报告。过程包括原始数据扫描、格式解析、跨页拼接等技术步骤。
研究突破
多模态 NFT 框架 OmniNFT
OmniNFT 是一个基于强化学习的 NFT 框架,使用 LTX-2/2.3 并提供预训练 LoRA 权重,实现音视频同步生成。该框架通过三种设计解决多模态奖励合并导致的梯度冲突:模态内奖励路由、层级梯度手术和区域损失重新加权。
AI 通过世界模型解谋杀谜
AI 通过构建世界模型解决新谋杀谜题,需推理未知线索和奇幻物理规则,证明其具备超越简单自动补全的世界理解能力。
开发者工具
Curo AI tutor 与 OpenAI 交流
一对一 AI 辅导工具 Curo 帮助学生逐步理解概念,并介绍了其与 OpenAI 的交流功能。内容包含具体版本和链接,强调了与公开模型的互动。
Cursor Pro 免费 1 年服务
Cursor Pro 团队发布免费 1 年服务(价值 240 美元),针对通过 .edu 邮箱验证的大学生,需是公开开源项目维护者。
行业观察
Marc Andreessen 给新人 AI 工程师建议
Marc Andreessen 建议新人 AI 工程师需掌握模型内部(如 vLLM、tensor parallelism)、非凸优化、合成数据处理等基础技术,强调通过训练小模型到大模型(如 800B 参数)、集群构建和服务化部署实现职业竞争力,并指出基础设施(如 GPU 集群)比个人设备更关键。
Marc Andreessen 谈前沿模型
Marc Andreessen 引用了 Clifford Asness 提出的前沿模型观点,强调未来可能需要直接公共控制的前沿模型。分析显示该观点与行业对大模型的关注点高度契合。