AI 日报
收录 6 条重要资讯
AI HOT 日报 (evening)
本期导读
本时段,AI Agent能力持续深化,Sakana AI的Fugu Ultra在魔方求解和古典文本解读等复杂任务中展现卓越性能。GLM-5.2通过集成Perplexity Agent API扩展了其生态应用。同时,字节跳动对Seedance模型进行了功能性重磅升级,进一步拓宽了多模态内容的生成边界。智能体与平台
Fugu Ultra解魔方优于Model A
Sakana AI的Fugu Ultra与前沿模型合作编写纯Python Rubik’s Cube求解器,在300个随机扭转立方体上测试。Fugu Ultra平均19.72步、最多19步成功,表现优于Model A的19.76步,且Model B、C完全失效,展示了其在复杂任务中的卓越规划与执行能力。
Fugu Ultra解读日本古典散写
Sakana AI测试Fugu Ultra模型解读1610年日本古典信件散写阅读顺序,其准确率达0.80。对比测试中,模型A和模型B的准确率为0.24,而模型C则完全失败。这突显了Fugu Ultra在处理复杂、低资源语言文本理解方面的显著优势。
GLM-5.2集成Perplexity Agent API
Z.ai的GLM-5.2模型现已登陆Perplexity Agent API,支持沙盒环境下的网络搜索工具调用,具备长时程编码和代理工作流能力。该集成采用Search as Code架构,提供OpenAI兼容接口,并承诺无加价的原生定价,扩展了其代理应用生态。
模型发布
字节跳动Seedance 2.5重磅升级
字节跳动发布Seedance 2.0升级版及Seedance 2.5,支持生成30秒短片、原生4K分辨率,并可输入50个多模态参考素材及3D白膜。同时推出AI版权商业化平台。此前,Seedance 2.5综合基准分数提升0.5分,豆包Seed 2.1达Opus 4.6性能。