AI HOT 日报 (morning)
基础设施
Dell/NVIDIA/CoreWeave 发布 Rubin NVL72 平台
Dell Technologies、NVIDIA 与 CoreWeave 合作推出 Vera Rubin NVL72 平台,并交付首个 NVL72 机架给 CoreWeave。该平台搭载 72 个 Rubin GPU、36 个 Vera CPU,提供 3.6 exaFLOPS FP4 推理性能、75TB 快速内存和 260TB/s NVLink 带宽,已通过 L11 标准测试。
华为 Kirin 芯片将采用 1.5 微米 3D 堆栈架构
华为推进 Hybrid Bonding 技术,2026 年 Kirin 芯片将采用 1.5 微米粘结 pitches 的 3D 堆栈架构,下一代产品将迈向 1 微米水平。该技术相比 TSMC 6 微米 SoIC 及 Intel 9 微米 Foveros Direct,实现了 16-36 倍更高的互连密度。
模型发布
Meta 发布 Llama 4 700B 模型
Meta 发布 Llama 4 模型,参数量达 700B,基准测试得分 85.2,超越 Anthropic 的 Claude 4.7(70B 参数,得分 82.1)。该模型在参数规模上领先竞争对手,发布时间与行业趋势一致。
Grok Imagine Video 1.5 Preview 领跑 Video Arena
Grok-Imagine-Video-1.5-Preview (720p) 已在 Grok APIs 上发布,并在 Video Arena 取得 #1 位置,较上一版 Grok-Imagine-Video (720p) 提升 52 分,超过 Seedance-2.0 与 HappyHorse。
GPT-5.5 复杂推理与代码生成优于 Opus-4.8
Kiro 系统测试发现 GPT-5.5 在多个基准测试中优于 Opus-4.8,在复杂推理任务中准确率提升 12%,在代码生成效率上提升 18%。
XSquareRobot 开源 VLA 模型 Wall-OSS-0.5
XSquareRobot 开源 Wall-OSS-0.5 VLA 模型,无需任务特定微调即可部署。在 17 个真实机器人任务上零样本测试,Rope Tightening 得分 82/100,Block Sorting 100。与 π0.5 相比,平均任务进度提升 17.5 分。
开发者工具
Codex 展现 TypeScript 迁移中 ad-hoc codemods 能力
用户观察到 Codex 在大规模 TypeScript 迁移中执行了自定义代码编辑(ad-hoc codemods),对此表示印象深刻,显示其在代码重构和自动化方面的能力。
NVIDIA 发布 SkillSpector 安全扫描工具
NVIDIA 发布 SkillSpector 安全扫描工具,提供 64 个安全检查覆盖 16 个类别,结合静态分析和 LLM 语义评估,支持提示注入检测、凭据盗窃检测等功能,并可与 CI/CD 集成。
Sandcastle 项目集成多款 AI 工具进行开发
Sandcastle 项目利用 Codex、Claude Code、Cursor、GPT-5 等多个 AI 工具进行集成开发,旨在强调团队协作与技术融合。该项目分享了使用这些工具编写工作流的具体方法。
LandingAI 黑客松项目 ArthaNethra 构建金融知识图谱
LandingAI 黑客松项目 ArthaNethra 展示了从 PDF 构建可查询、可溯源金融知识图谱的完整流程,涵盖文档摄入、实体提取、归一化、双库索引及风险检测,并利用 Claude Haiku 和 Sonnet 进行差异化解析。
产品更新
Apple WWDC AI 更新:Siri/on-device AI 整合 Google Gemini
Apple 将在下月 WWDC 发布 Siri 和 on-device AI 升级,采用蒸馏版 Google Gemini 模型在 iPhone 芯片上本地运行。对于设备无法处理的查询,将路由至 Google Cloud 使用 Nvidia 机密计算技术处理。
微博算法推荐更新:建议间隔发帖优化曝光
用户对近期微博推荐算法表示疑虑,指出过多连发帖导致曝光下降。产品负责人分析强调,合理时间间隔发帖能提升可见度,以优化算法推荐效果。
ChatGPT 翻译功能更新:支持高 Valyrian 语言
ChatGPT 团队近期对翻译功能进行了更新,引用了 Codex 团队的合并信息,并提到了支持高 Valyrian 语言。此次更新强调了与前代产品相比的改进。
商业与人事
OpenAI 成立机器人团队
OpenAI 成立机器人团队,招聘全栈硬件、操作、系统和 ML 工程师,专注于机器人技术与 ML 研究的协同开发。团队领导 Aditya Ramesh 主导世界模拟研究,目标是支持熟练工人构建未来基础设施。
CEO 和 CTO 因编码代理重新开始编码
Guillermo Rauch 报道,公共公司 CEO 和 CTO 因 Claude Code 等编码代理的出现,重新开始编码,以推动企业级软件交付。此举强调代理技术使堆栈对整个组织透明化。
黄仁勋揭 AI 裁员真相:多因疫情过度招聘
NVIDIA CEO Jensen Huang 指出,多数公司打着 AI 旗号的裁员实为甩锅,2026 年第一季度 86 家科技公司裁员 8 万多人,创三年最高。哈佛商业评论调研发现,这些裁员多因疫情期间过度招聘,而非 AI 技术替代。
NVIDIA GTC Taipei keynote 预告
NVIDIA 官方预告 GTC Taipei keynote,Jensen Huang 将发表演讲。活动将展示 NVIDIA 在 AI 领域的最新进展和技术亮点。
研究突破
MIT/Stanford 等研究:AI 效率增益错觉
MIT、Stanford 等大学联合研究发现,人们在处理简单任务时过度依赖 AI,预计节省 55.7 秒实际仅节省 7.5 秒。研究涉及 2,691 名参与者,指出 AI 依赖来源于主观效率感,而非客观生产力提升。
Meta 发布 VINS-120K 4K+图像编辑数据集
Meta 发布 VINS-120K 数据集,包含 120K 个 4K+ 分辨率的图像编辑三元组,涵盖 13 种编辑类型。数据源自真实世界高分辨率视频和开源编辑数据,经过视觉质量、指令对齐和美学忠实度过滤。