AI 精选动态智能评分 65

DeepSeek 与 Xiaomi 永久降价

来源: twitter关注列表

作者: Chubby♨️ (@kimmonismus)

发布于: 2026-05-27

收录于: 2026-05-27

AI 推荐理由

值得关注其通过压缩注意力和缓存路径把百万级上下文推理成本结构性打下来的实现方式，可用于评估长上下文模型的可持续定价能力。

核心解读

DeepSeek 将 V4-Pro 的 75% 降价改为永久生效，Xiaomi 将 MiMo V2.5 的价格最高下调 99%，并从今天开始执行。文中称，支撑这些价格的关键在于长上下文推理的工程优化：DeepSeek V4 采用混合注意力架构，包含每 4 个 token 压缩为 1 个 KV 条目的 Compressed Sparse Attention（CSA），以及每 128 个 token 压缩为 1 个条目的 Heavily Compressed Attention（HCA）。其 V4-Pro 在 100 万 token 上下文下的 KV cache 仅为 V3.2 的 10%，单 token 推理 FLOPs 降至 27%，总参数量为 1.6 万亿，但每个 token 仅激活 490 亿参数；Xiaomi 的 MiMo 通过 SGLang HiCache、Sliding Window Attention、专家并行优化和输入长度分桶，将 GPU/CPU/SSD 间的 KV cache 数据传输量降至原来的约 1/7，缓存 token 数提升 5 倍。

#产品更新#大模型#技术突破

阅读原始全文