AI 日报收录 41 条重要资讯

AI HOT 日报 (morning)

时间范围: 2026年06月28日 00:00 ~ 2026年06月29日 00:00

生成于: 2026年06月29日 00:01

本期导读

本时段，AI模型领域呈现多点突破，Meta发布Llama 4 784B大模型，xAI的Grok 4.5性能已接近Claude Opus。在商业层面，Anthropic企业业务实现显著增长，AI对电力需求的影响推动了基础设施投资。此外，围绕AI出口管制和企业级协作工具的讨论也日益增多，显示行业在技术与应用两端的快速演进与挑战。

模型发布

Meta 发布 Llama 4 784B 大模型

xAI Grok 4.5 性能接近 Opus

Elon MuskxAISpaceX

Elon Musk宣布xAI的Grok 4.5（基于1.5万亿参数的V9基础模型）已在SpaceX和Tesla进行私人beta测试，并融入Cursor数据进行训练。早期评估显示其性能接近或超越Claude Opus。Musk透露Grok v8（0.5万亿参数）训练于2023年12月存在缺陷，新版本得益于SpaceX顶尖工程师的加速迭代，xAI计划每月发布从零训练的新模型并通过RL持续改进。

Owl Alpha 确认为美团 LongCat-2.0

rohanpaul_aiOpenRouterMeituan

Rohan Paul爆料，OpenRouter上增长最快的智能体模型Owl Alpha实为美团LongCat-2.0-Preview，采用1.6万亿参数MoE架构，活跃参数480亿，动态范围330-560亿，原生支持100万token上下文。该模型在OpenRouter测试近两月，月处理token达10.1万亿，日处理5590亿，月增长242%。

Google 开源时间序列基础模型 TimesFM

Google Researchberryxia

Google Research发布时间序列预测基础模型TimesFM 2.5版本，参数量降至2亿，上下文长度从2048提升至16K，并支持通过3000万分位数预测头输出置信区间，已集成至BigQuery ML等产品。

GLM-5.2 Quelques-Mythos 性能评测

emollick

研究机构评估实验模型GLM-5.2性能，在部分基准测试中接近GPT-5.2领域模型，但仍比Mythos类模型偏弱，显示开源模型持续占据竞争性地位。

智能体与平台

Anthropic 发布 Claude Tag 赋能企业协作

AnthropicdoteyGergely Orosz

Anthropic发布Claude Tag (Beta)，允许企业用户通过Slack频道提及Claude发起工作流，支持组织级工具集成、持久记忆和异步执行。Gergely Orosz分析其核心价值在于云端AI与内部系统无缝对接，使新员工、非工程师和代码库陌生开发者能实现无配环境直达工作。

Vida 开源 BrowserBC 提升浏览器自动化

Vidatestingcatalog

Vida开源BrowserBC框架，将浏览器会话转化为可复用技能，使WebArena-Hard通过率从60.5%提升至81.4%、ClawBench通过率从32.9%提升至68.4%，并将平均工具调用数从31.2次减少至22.7次。

OpenRouter 自动化评测开源模型

OpenRouterParasail.ioZai.org

OpenRouter与Parasail.io和Zai.org合作，使用AutoExacto meta-benchmark对多数开源模型进行自动化评测并公开结果。该工具默认用于路由模型调用，AutoExacto基于GPQA和TAU-Bench，模型排行榜显示Parasail.io和Zai.org排名靠前。

基础设施

Starlink 移动通信测试有效

cb_dogeStarlink

Starlink在移动通信领域的有效性测试取得进展，具体细节涉及技术推进，显示其在全球通信基础设施中的潜力。

Google 加速器传红波预警机制

Googlerohanpaul_ai

Google系统利用加速器技术传递红波预警，该机制通过详细的工作原理说明，旨在提高预警系统的响应速度和准确性。

DeepSeek 开源投机解码框架 DSpark

DeepSeekberryxia北京大学

DeepSeek开源DSpark投机解码框架，通过并行backbone加顺序Markov head解决后缀衰减，并引入置信度调度实现负载感知验证。在DeepSeek-V4生产环境中，单用户生成速度比MTP-1基线快60-85%，吞吐提升1.5至5倍，且不影响输出质量。开源内容包括模型checkpoint和训练代码（MIT协议），与北京大学联合开发。

AI 算力推高电力设备需求

tinyfoolGoogleMicrosoft

AI训练与推理导致的电力需求激增，促使Google、Microsoft等科技巨头大量采购GE海员级燃气轮机，相关电力设备与公用事业股股价因此出现上升趋势。

研究突破

AI 技术加速发展类比曼哈顿计划

tinyfoolNVIDIA

媒体通过历史类比分析当前AI技术发展轨迹，指出相较于上一代AI研究周期的5-10年，当前技术迭代压缩至2-3年。NVIDIA等厂商现采用更频繁的芯片产品迭代策略（每18个月更新GPU架构），而模型层面计算成本降低了近60%（2023年与2019年对比），推动从少样本学习向超大规模训练转移，其中GPT-4训练成本突破1亿美元，近月开源模型Mixtral-8x22B参数量超800亿。

人力资源流动性影响 AI 项目风格

rohanpaul_ai

研究指出人力资源流动性对AI项目的风格化产生影响，揭示了团队构成和人员变动如何塑造AI研发和实施的独特路径。

Sakana AI 发布 Fugu 多模型编排系统

Sakana AIrohanpaul_ai

Sakana AI发布Fugu技术报告，介绍一种多模型编排系统，包含Regular（快速路由）和Ultra（动态工作流）两个版本。核心创新在于通过轻量层学习用户请求，动态选择最适合的专家模型或构建协作流程，区别于简单的投票或固定规则方法。

DAIR.AI 分析 LLM 组合收益上限

DAIR.AI

DAIR.AI转述一篇论文，分析了来自21家提供商的67个模型，证明任何路由、投票、级联或混合代理策略的准确率上限为1减去beta（所有候选模型都答错的查询比例）。论文指出，常用去相关假设不能保证改进空间，实际共失败高度集中在答案格式而非主题，建议在采用组合策略前先测量beta。

AI 从业者年报披露技术动态

cb_doge

一份AI从业者年报披露了与公开新模型发布相关的技术动态，包含公司名、规模数据、技术细节及与竞争对手的对比，为行业提供深入洞察。

政策与安全

奥地利提议欧盟为Anthropic设欧洲基地

奥地利欧盟Anthropic

奥地利向欧盟提议通过政治和法律手段，让Anthropic在欧洲运营部分业务，以减轻欧洲对美国AI出口管制的依赖，但面临所有权和出口法律约束等挑战。

中方 AI Labs 被指系统性盗窃模型

White HouseAnthropicindigox

白宫与Anthropic指责“中国AI Labs系统性盗取模型”，认为这是一个渗透到普通开发者的经济副产品，而不仅仅是精英研究员的讨论。文章引用了参数、时间、金额等明确数据。

产品更新

Codex AI 模型多项改进提升体验

Codexthsottiaux

Codex AI模型落地多项改进，通过更流畅的滚动、更清晰的设置搜索、更好的元素对齐以及新增的专用Pets面板，增强了长线程导航和用户体验。