AI 精选动态智能评分 67

DiffSynth-Studio 推出 Offload Training

来源: twitter关注列表

作者: ModelScope (@ModelScope2022)

发布于: 2026-05-20

收录于: 2026-05-20

AI 推荐理由

这条更新的关键点在于把训练显存占用压到单层级别，并明确给出了 4GB 到 1.4GB 的实测示例，适合关注低显存训练方案的人直接看文档和实现。

核心解读

DiffSynth-Studio 发布了 Offload Training 功能，称可让用户在单张消费级 GPU 上训练 Qwen-Image 或 Wan2.2-14B 等模型。其示例显示，一个 10 层 toy model 的显存占用从 4GB 降到 1.4GB VRAM；实现方式是仅将当前层权重加载到 GPU，计算后立即 offload，通过 PyTorch Module Hooks 将显存占用从 O(N layers) 降为 O(1 layer)，且不需要改动模型代码。该功能在单 GPU 训练场景下可通过 `--enable_model_cpu_offload` 开启。

#开发者工具#基础设施#开源

阅读原始全文