返回精选
AI 精选动态 智能评分 63

来源: twitter关注列表
作者: Rohan Paul (@rohanpaul_ai)
发布于: 2026-05-18
收录于: 2026-05-18
AI 推荐理由
这条内容对做多模态模型、图像生成和端到端架构优化的从业者很有参考价值,尤其能帮助判断新一代图像模型在架构与能力边界上的竞争方向。
核心解读
HiDream 开源了 8B 图像模型 HiDream-O1-Image,主打像素级统一 Transformer 架构,取消传统 VAE+文本编码器分离设计,并支持文生图、长文本渲染、指令编辑、主体定制和分镜生成。文章给出的结果显示,该模型在长文本渲染上接近更大模型表现,说明图像生成路线可能从“扩散管线”向端到端统一建模继续演进。
#模型发布#开源#技术突破