AI 精选动态
智能评分 60
Fable 5实现Gemma 4 255 tok/s
AI 推荐理由
此数据展示了 Fable 5 在端侧推理优化的具体效果,值得关注该工具的实际表现并尝试 demo。核心解读
@xenovacom 使用 Fable 5 编写内核,在 M4 设备上将 Gemma 4 在 WebGPU 上的推理速度提升至 255 tok/s,并公开了可浏览器试用的 demo。
全文
“Agentic kernel optimization is the future of on-device inference”
@xenovacom used Fable 5 to write kernels that pushed Gemma 4 to a massive 255 tok/s on WebGPU with M4. He shared the demo, so you can try in your browser!! https://t.co/xPuh5OLGEt
https://video.twimg.com/amplify_video/2072416477945417728/vid/avc1/2772x1774/GxZLlJSrG1wjRLvv.mp4?tag=28