AI 精选动态
智能评分 63
AI 推荐理由
这条内容对做多模态模型、图像生成和端到端架构优化的从业者很有参考价值,尤其能帮助判断新一代图像模型在架构与能力边界上的竞争方向。核心解读
HiDream 开源了 8B 图像模型 HiDream-O1-Image,主打像素级统一 Transformer 架构,取消传统 VAE+文本编码器分离设计,并支持文生图、长文本渲染、指令编辑、主体定制和分镜生成。文章给出的结果显示,该模型在长文本渲染上接近更大模型表现,说明图像生成路线可能从“扩散管线”向端到端统一建模继续演进。