返回精选
AI 精选动态 智能评分 62

来源: twitter关注列表
作者: SemiAnalysis (@SemiAnalysis_)
发布于: 2026-05-10
收录于: 2026-05-10
AI 推荐理由
ROCm 75倍性能提升是AI基础设施层面的重要进展,对开发者使用AMD平台部署大模型有直接影响,且明确了剩余差距和技术路径。
核心解读
AMD ROCm软件栈在DeepSeek V4发布后14天内性能提升超过75倍,通过融合mHC操作、RoPE哈达玛变换优化以及使用TileLang和Triton重写关键kernel实现,团队正目标在未来几周内追平B200性能。
#ROCm性能优化#DeepSeek V4#AI基础设施