AI 日报收录 35 条重要资讯

AI HOT 日报 (morning)

时间范围: 2026年05月31日 00:00 ~ 2026年06月01日 00:00

生成于: 2026年06月01日 00:01

本期导读

本时段，AI 基础设施领域进展显著，Dell/NVIDIA/CoreWeave 联合发布 Rubin NVL72 平台，华为 Kirin 芯片推进 3D 堆栈架构。模型方面，Meta 发布 Llama 4 700B，Apple WWDC 将整合 Google Gemini，行业聚焦算力基建与模型应用。

基础设施

Dell/NVIDIA/CoreWeave 发布 Rubin NVL72 平台

DellNVIDIACoreWeave

Dell Technologies、NVIDIA 与 CoreWeave 合作推出 Vera Rubin NVL72 平台，并交付首个 NVL72 机架给 CoreWeave。该平台搭载 72 个 Rubin GPU、36 个 Vera CPU，提供 3.6 exaFLOPS FP4 推理性能、75TB 快速内存和 260TB/s NVLink 带宽，已通过 L11 标准测试。

华为 Kirin 芯片将采用 1.5 微米 3D 堆栈架构

HuaweiSemiAnalysis_

华为推进 Hybrid Bonding 技术，2026 年 Kirin 芯片将采用 1.5 微米粘结 pitches 的 3D 堆栈架构，下一代产品将迈向 1 微米水平。该技术相比 TSMC 6 微米 SoIC 及 Intel 9 微米 Foveros Direct，实现了 16-36 倍更高的互连密度。

模型发布

Meta 发布 Llama 4 700B 模型

Metainotharsh

Meta 发布 Llama 4 模型，参数量达 700B，基准测试得分 85.2，超越 Anthropic 的 Claude 4.7（70B 参数，得分 82.1）。该模型在参数规模上领先竞争对手，发布时间与行业趋势一致。

Grok Imagine Video 1.5 Preview 领跑 Video Arena

Groktestingcatalog

Grok-Imagine-Video-1.5-Preview (720p) 已在 Grok APIs 上发布，并在 Video Arena 取得 #1 位置，较上一版 Grok-Imagine-Video (720p) 提升 52 分，超过 Seedance-2.0 与 HappyHorse。

GPT-5.5 复杂推理与代码生成优于 Opus-4.8

OpenAIAnthropichubeiqiao

Kiro 系统测试发现 GPT-5.5 在多个基准测试中优于 Opus-4.8，在复杂推理任务中准确率提升 12%，在代码生成效率上提升 18%。

XSquareRobot 开源 VLA 模型 Wall-OSS-0.5

XSquareRobotModelScope2022

XSquareRobot 开源 Wall-OSS-0.5 VLA 模型，无需任务特定微调即可部署。在 17 个真实机器人任务上零样本测试，Rope Tightening 得分 82/100，Block Sorting 100。与 π0.5 相比，平均任务进度提升 17.5 分。

开发者工具

Codex 展现 TypeScript 迁移中 ad-hoc codemods 能力

Codexsteipete

用户观察到 Codex 在大规模 TypeScript 迁移中执行了自定义代码编辑（ad-hoc codemods），对此表示印象深刻，显示其在代码重构和自动化方面的能力。

NVIDIA 发布 SkillSpector 安全扫描工具

NVIDIAbibryam

NVIDIA 发布 SkillSpector 安全扫描工具，提供 64 个安全检查覆盖 16 个类别，结合静态分析和 LLM 语义评估，支持提示注入检测、凭据盗窃检测等功能，并可与 CI/CD 集成。

Sandcastle 项目集成多款 AI 工具进行开发

Sandcastledotey

Sandcastle 项目利用 Codex、Claude Code、Cursor、GPT-5 等多个 AI 工具进行集成开发，旨在强调团队协作与技术融合。该项目分享了使用这些工具编写工作流的具体方法。

LandingAI 黑客松项目 ArthaNethra 构建金融知识图谱

LandingAIshao__meng

LandingAI 黑客松项目 ArthaNethra 展示了从 PDF 构建可查询、可溯源金融知识图谱的完整流程，涵盖文档摄入、实体提取、归一化、双库索引及风险检测，并利用 Claude Haiku 和 Sonnet 进行差异化解析。

产品更新

Apple WWDC AI 更新：Siri/on-device AI 整合 Google Gemini

AppleGooglekimmonismus

Apple 将在下月 WWDC 发布 Siri 和 on-device AI 升级，采用蒸馏版 Google Gemini 模型在 iPhone 芯片上本地运行。对于设备无法处理的查询，将路由至 Google Cloud 使用 Nvidia 机密计算技术处理。

微博算法推荐更新：建议间隔发帖优化曝光

Weibotinyfool

用户对近期微博推荐算法表示疑虑，指出过多连发帖导致曝光下降。产品负责人分析强调，合理时间间隔发帖能提升可见度，以优化算法推荐效果。

ChatGPT 翻译功能更新：支持高 Valyrian 语言

ChatGPTCodexdotey

ChatGPT 团队近期对翻译功能进行了更新，引用了 Codex 团队的合并信息，并提到了支持高 Valyrian 语言。此次更新强调了与前代产品相比的改进。

商业与人事

OpenAI 成立机器人团队

OpenAIEMostaque

OpenAI 成立机器人团队，招聘全栈硬件、操作、系统和 ML 工程师，专注于机器人技术与 ML 研究的协同开发。团队领导 Aditya Ramesh 主导世界模拟研究，目标是支持熟练工人构建未来基础设施。

CEO 和 CTO 因编码代理重新开始编码

Guillermo Rauchpmarca

Guillermo Rauch 报道，公共公司 CEO 和 CTO 因 Claude Code 等编码代理的出现，重新开始编码，以推动企业级软件交付。此举强调代理技术使堆栈对整个组织透明化。

黄仁勋揭 AI 裁员真相：多因疫情过度招聘

Jensen HuangAYi_AInotes

NVIDIA CEO Jensen Huang 指出，多数公司打着 AI 旗号的裁员实为甩锅，2026 年第一季度 86 家科技公司裁员 8 万多人，创三年最高。哈佛商业评论调研发现，这些裁员多因疫情期间过度招聘，而非 AI 技术替代。

NVIDIA GTC Taipei keynote 预告

NVIDIAJensen Huang

NVIDIA 官方预告 GTC Taipei keynote，Jensen Huang 将发表演讲。活动将展示 NVIDIA 在 AI 领域的最新进展和技术亮点。

研究突破

MIT/Stanford 等研究：AI 效率增益错觉

MITStanfordrohanpaul_ai

MIT、Stanford 等大学联合研究发现，人们在处理简单任务时过度依赖 AI，预计节省 55.7 秒实际仅节省 7.5 秒。研究涉及 2,691 名参与者，指出 AI 依赖来源于主观效率感，而非客观生产力提升。

Meta 发布 VINS-120K 4K+图像编辑数据集

MetaModelScope2022

Meta 发布 VINS-120K 数据集，包含 120K 个 4K+ 分辨率的图像编辑三元组，涵盖 13 种编辑类型。数据源自真实世界高分辨率视频和开源编辑数据，经过视觉质量、指令对齐和美学忠实度过滤。