AI 精选动态
智能评分 65
AI 推荐理由
针对 llama.cpp 生态的实用模型发布,集成 TurboQuant 和投机解码降低显存需求,对开发者本地部署有直接价值。核心解读
AtomicChat 在 Hugging Face 发布了 Qwen3.6-27B-UDT-MTP-GGUF 模型,基于 Qwen 3.6 27B 进行 UDT 动态 imatrix 量化,并集成了 NextN 投机解码,提供多种量化等级的 GGUF 文件及多模态投影器,旨在提升本地推理效率。