AI 日报收录 45 条重要资讯

AI HOT 日报 (morning)

时间范围: 2026年06月23日 00:00 ~ 2026年06月24日 00:00

生成于: 2026年06月24日 00:01

本期导读

本时段，AI 领域在模型应用与基础设施层面均有显著进展。Anthropic 推出 Claude Tag 将 AI 深度融入企业协作流程，OpenAI 扩展 Daybreak 网络安全计划增强防御能力。同时，字节跳动发布 Seedance 2.5 等系列模型，百度开源 Unlimited-OCR 提升文档处理效率，多项模型在细分领域展示出 SOTA 性能，推动 AI 在商业和技术研究上的边界。

模型发布

字节跳动发布Seedance 2.5等系列模型

ByteDanceberryxiaxiaohu

字节跳动发布Seedance 2.5模型，综合基准测试分数提升0.5分。同时推出性能达到Claude Opus 4.6水平的豆包Seed 2.1模型和Seeddream 5.0图像模型。Seedance 2.5支持一次生成30秒短片、原生4K分辨率、50个全模态参考素材输入及3D白膜，并推出AI版权商业化平台，允许使用官方授权IP电影版权进行创作分成。

百度PP-OCR团队开源Unlimited-OCR模型，总参数量30亿（激活5亿），在OmniDocBench v1.5/v1.6上达成SOTA。该模型采用Reference Sliding Window Attention (R-SWA) 机制，保持常量KV缓存，支持单次前向传递处理40+页文档，并在OmniDocBench上取得93%准确率，比DeepSeek-OCR高6个百分点，可处理数百页文档。

GLM-5.2模型更新及商业部署进展

OpenRouterAYi_AInotesZixuanLi_

GLM-5.2在OpenRouter平台上的场景充量表现显著。与Claude Opus 4.8真实bug修复测试对比，GLM-5.2虽速度较慢、token多67%、工具调用多2.3倍、价格便宜一半，但能主动清理死代码并确保构建通过，而Opus修复后生产构建崩溃。GLM-5.2已接入Perplexity Agent API，支持网络搜索和长时程编码。Unsloth AI将GLM-5.2量化至2-bit GGUF，大小从1.51TB压缩至238GB(-84%)，保留约82%准确率，可在Mac Studio M3 Ultra以21.6 tok/s运行。

Catnip MaineCoon-22B实时音视频模型发布

Catnipfcholletrohanpaul_ai

Catnip AI 发布 MaineCoon，一个22B参数的实时文本到音视频模型，采用双流Diffusion Transformer和强化在线策略蒸馏（ROPD）。模型在单张H100 GPU上达到47.5 FPS，首帧生成低于1秒，音频-视频生成成本低于$0.001/秒并持续下降。支持超10分钟连续流式生成，通过代理缓存管理和长上下文回滚保持一致性，在SocialVideo Bench上达到SOTA性能。

Hao AI Lab发布FastWan-QAD视频生成模型

Hao AI Labhaoailab

Hao AI Lab发布FastWan-QAD视频生成模型系列，采用FastVideo的量化感知蒸馏(QAD)技术，在单张NVIDIA GeForce RTX 5090上端到端生成5秒480P视频仅需1.8秒，并同时提供针对RTX 4090优化的FP8检查点。

Mistral AI 发布 OCR 4，盲测胜率72%

Mistral AItestingcatalog

Mistral AI 发布 OCR 4 模型，在盲测中平均胜率达 72%，OlmOCRBench 得分 85.20，支持 170 种语言和 10 个语言组。该模型可返回边界框、类型分类和内联置信度分数，并作为 Search Toolkit 的组件单容器运行。

智能体与平台

Anthropic Claude Tag深度融入企业协作

Anthropickarpathyrohanpaul_ai

Anthropic 发布 Claude Tag，将 Claude 作为持久 AI 助理集成到 Slack 等团队协作环境。它能记忆上下文、主动更新、分解任务、编写代码和提交 PR。内部测试显示，产品团队 65% 的代码由其创建。基于 Opus 4.8 模型，现已向 Claude Enterprise 和 Team 客户提供 Beta 测试。

Sakana AI Fugu Ultra多项基准表现亮眼

SakanaAILabs

Sakana AI 发布 Fugu Ultra 模型的特定基准测试结果。在与三个前沿模型合作编写纯Python Rubik’s Cube 求解器测试中，Fugu Ultra 平均 19.72 步、最多 19 步，优于 Model A (19.76 步)，而 Model B、C 完全崩溃。此外，Fugu Ultra 在解读 1610 年日本古典信件散写阅读顺序测试中准确率达 0.80，对比模型 A 和 B 的 0.24，模型 C 失败。

Vercel Eve：Next.js for agents框架

Vercelomarsar0

elvis 称 Vercel 的 Eve 是 Next.js for agents 框架，全面匹配工具、技能和评估，具备快速构建的优势，旨在提供完整技术生态，促进社区反响和高效开发。

AI 安全与研究

OpenAI扩展Daybreak网络安全计划

OpenAIOpenAIDevshongming731

OpenAI 扩展 Daybreak 网络安全计划，发布 GPT-5.5-Cyber 模型，在 CyberGym 基准上以 85.6% 击败 Mythos 5 (81.8%)。该计划通过 Codex Security 插件，已扫描超 3000 万次提交、覆盖 3 万多个代码库，自动修复超 50 万个问题。同时，扩展 Codex for Open Source 计划，为 3500+ 开源维护者提供 6 个月 ChatGPT Pro 订阅，并启动 Patch the Planet 倡议，联合 Trail of Bits 帮助开源项目验证漏洞、开发补丁并协调披露，同时持续投资 Rust 生态。

Mozilla用Claude Mythos发现400+安全漏洞

Mozillaclairevopmarca

Mozilla 在 Fable 发布前使用 Claude Mythos 模型对 Firefox 的 1000 万行代码库进行秘密测试，成功发现并修复了超过 400 个安全漏洞，包括隐藏十多年的漏洞。Mozilla 杰出工程师 Brian Grins 分享称，代理漏洞发现框架的设置与模型本身同等重要，并可在半天内复现。

ThousandsWorlds数据集助力系外行星研究

OxfordCambridgecgeorgiaw

Oxford/Cambridge++ 的研究团队发布了 ThousandsWorlds 数据集，包含 1760 场模拟，覆盖 5 种全球气候模型、8 种行星参数和在 32×64×10 的纬度‑经度‑气压网格上的大气变量。该数据集提供三套嵌套基准子集、两种评估协议及八个基线方法，旨在帮助检测类地系外行星大气中的潜在生命迹象。

反转贝尔曼方程可恢复智能体世界模型

Jon RichensAlistair Letcher

Jon Richens 转发 Alistair Letcher 的研究，证明通过逆向贝尔曼方程可从价值函数恢复智能体的世界模型，挑战了无模型强化学习代理不建模环境的传统认知。

Artificial Analysis发布语音转语音模型基准

ArtificialAnlys

Artificial Analysis 发布 Speech to Speech Index，综合 Big Bench Audio、Full Duplex Bench 和 τ-Voice 三个数据集评估原生语音转语音模型质量。GPT-Realtime-2 (High) 以 77.2% 领先，Grok Voice Think Fast 1.0 以 75.7% 紧随其后。Deepslate Opal 最快（TTFA 0.44s），Gemini 3.1 Flash Live Preview (Minimal) 成本最低（$1.50）。

开发者工具

Kling AI开源限问活动与竞品对比

Kling_ai

Kling AI 启动开源限问活动，描述了参与指南和与竞品的对比，包含版本号、参与链接与动作提示，旨在促进社区参与和技术交流。

腾讯EdgeOne Makers：Agent云平台

Tencentberryxia

腾讯发布EdgeOne Makers平台，旨在成为首个为Agent设计的云平台。平台开源，支持Node.js、Go、Python云函数，集成LangGraph、Claude SDK等Agent框架，使AI Agent能通过CLI自动完成Web应用部署，无需人工操作控制台。

基础设施

Hugging Face成机器人视频AI数据中心

Hugging FaceClementDelangue

Hugging Face 正在成为公共和私有数据存储的热门平台，特别适用于机器人和视频AI等数据量大、持续增长的领域。2025年初公共机器人数据集从1,000增长到60,000个，私有数据集数量也翻倍。单个机器人全天录制数据速率达140 MB/s，通过Hub直播和预热缓存可提升至1,326 MB/s。

NVIDIA Rubin AI服务器液冷方案

NVIDIArohanpaul_ai

NVIDIA Rubin AI服务器采用45°C水-乙二醇液冷，取代传统风冷，可将冷却用水从约260万加仑/MW/年降至近零。50MW设施每年可节省超过400万美元的冷却成本，并能将机架单元从6个缩小到2个。

Gemma-4-26B模型16路并行推理演示

GoogleNVIDIAgooglegemma

Onur Solmaz 在单台 DGX Spark（128GB 统一内存）上成功运行 NVIDIA 的 Gemma-4-26B-A4B-NVFP4 模型，实现 16 路并行推理，单路 18 tokens/s，聚合 300 tokens/s，最高可扩展至 32 路，且尚未使用 flashinfer 优化。

商业与人事

Oracle裁员13%归因AI部署

Oraclerohanpaul_ai

Oracle在年度SEC文件中披露，过去12个月裁员13%，员工数从162,000降至141,000，并将裁员直接归因于AI部署。重组支出从3.74亿增至18亿美元，资本支出增长162%至557亿美元，自由现金流降至负237亿美元。

Starlink支持教育技术普及

Starlinkcb_doge

Starlink正在通过提供卫星互联网服务，支持教育技术的普及，旨在打破地理限制，让更多地区享受现代教育资源。

政策与安全

USAID资金挪作抗议助罚引发关注

USAIDelonmusk

美国国务院 USAID 被曝通过多方资金支持 Cincinnati 国立基金会组织的街头抗议手册出版，成果涉及多方利益相关者，并受文件披露影响，引发对资金流向和政治干预的关注。