AI HOT 日报 (morning)
模型发布与优化
NVIDIA开源MiniMax M3多模态MoE模型
NVIDIA 发布并开源 MiniMax M3/M3 模型于 GMI Cloud 平台,提供 Hugging Face 免费接入。该原生多模态 MoE 模型总参数约 428B,活跃参数约 23B,60 层,支持 1M 上下文(文本、图像、视频)。其 MiniMax Sparse Attention 在 1M 上下文下实现 prefill 提速 9 倍、decode 提速 15 倍、单 token 计算量降至 1/20,并支持 NVIDIA Blackwell/H200/AMD MI350X/MI355X 硬件加速。
Meta Llama 4 发布 700B 参数模型
Meta 发布 Llama 4 700B 参数模型,显著提升对话理解和生成能力,据称在实场表现中超越上一代。
Kimi K2.7 Code 在 Cloudflare Workers AI 发布
Kimi_Moonshot 在 Cloudflare Workers AI 上发布 Kimi K2.7 Code 模型,专注于长时程智能体编码任务,推理效率相比 Kimi K2.6 提升 30%。
NVIDIA Research 发布 MotionBricks 实时角色动画模型
NVIDIA Research 推出开源 MotionBricks 模型,包含 35 万段动作片段,支持 15,000 FPS 实时角色动画,可直接用于机器人且无需手工转场或微调,相关论文、演示和代码已在 SIGGRAPH2026 发布。
研究突破与基准
Nature Medicine发布医疗AI模型排行榜
Nature Medicine研究显示,在12名US外科医生盲测中,通用大模型(Google、OpenAI、Anthropic)在医疗领域表现优于专业医学信息平台EvidenceOpen和UpToDate,形成行业首次对比数据。
DiffusionGemma基准测试:4倍速度6倍错误
基准测试显示,DiffusionGemma 在 H100 (FP8) 上达 763 tok/s (总时 3.7s),但出现 28 条错误;而 Gemma4 26B A4B 速度 218 tok/s (总时 15.1s),仅有 5 条错误。DiffusionGemma 虽速度快 4 倍,但错误率比 Gemma4 高 6 倍,尤其在冷门主题上。
Google DeepMind AGI到超智能路线图论文
Google DeepMind 发布 60 页论文,阐述从 AGI 到超智能(ASI)的路线图,定义 AGI 为在大多数认知任务达平均人类水平,ASI 为能击败万名专家合作解决十年难题的系统,并指出能源、数据、算力等六大潜在瓶颈。
Fable视频项目创新评估体系
关于项目Fable Video的推荐文章指出,该项目被标高于行业同类产品,并在样本数据中呈现差异数据爆炸,其创新点体现在高精度评估体系和具体性能基准上。
智能体与平台
LandingAI Re-Ink实现再保险合同自动化
LandingAI的Re-Ink通过Agentic Document Extraction (ADE) 实现再保险合同自动化提取,将手动采集时间从40%降至核心流程,优化30%行政任务,错误率改善6%,预算利用率下降14%,准确率显著提升。
Browser Use 0.13.0 支持万任务自定义接口
Browser Use 发布 0.13.0 版本,重新构建以支持万任务和自定义接口,专注于搜索优化,并通过收购 Node.js 生态增加高效执行器,评估基于最新内部测量。
产品更新与开发者工具
OpenAI 推出 API 速率限制重置功能
OpenAI 推出可银行储存的 API 速率限制重置功能,Go、Plus、Pro、Business 用户获 1 次免费重置,Plus/Pro 用户可邀请最多 3 位好友各获额外重置,兑现期 30 天。
AI 网站导航指南提升用户互动性
OpenAI开发者指南分享了通过AI提升网站导航用户互动性的实际方法,强调其在用户体验优化方面的优势,并有具体技术文档支持。
Claude Fable 5 实践指南与成本分析
Claude Fable 5 实践指南总结共识:建议采用 Fable 规划、Sonnet 实现、Haiku 验证的工程模式;其在 Arena 排名 #17,6 月 22 日后成本约为 Opus 两倍($10/M 输入、$50/M 输出)。Stripe 已用其一天迁移 50M 行 Ruby 代码。
商业动态与政策
SpaceX 募资750亿美元,估值1.8万亿美元
SpaceX 在纳斯达克和星舰基地双现场上市,募资 750 亿美元,估值达 1.8 万亿美元(近期市值突破 2 万亿美元),Elon Musk 强调将商业项目(猎鹰和星链)资本化,星舰和火星计划保留独立体系。
Anthropic AI 新隐私政策引发争议
Meta 工程师对 Anthropic Claude 的新隐私政策表示担忧,因其禁止使用包含敏感设计文档和 IP 的提示词,导致用户立即停止使用新模型进行实验。