AI 精选动态
智能评分 62
AI 推荐理由
ROCm 75倍性能提升是AI基础设施层面的重要进展,对开发者使用AMD平台部署大模型有直接影响,且明确了剩余差距和技术路径。核心解读
AMD ROCm软件栈在DeepSeek V4发布后14天内性能提升超过75倍,通过融合mHC操作、RoPE哈达玛变换优化以及使用TileLang和Triton重写关键kernel实现,团队正目标在未来几周内追平B200性能。