AI 精选动态
智能评分 66
Project Vend: Phase two
AI 推荐理由
文章给出了从 Claude Sonnet 3.7 到 Sonnet 4.0/4.5 的升级、工具链改造以及多地点部署后的经营变化,适合关注 agent 落地与工具编排的人直接看原文。核心解读
Anthropic 与 Andon Labs 公布 Project Vend 第二阶段结果,测试对象是改造后的 Claude“Claudius”在真实自动售货店场景中的经营表现。相较第一阶段使用的 Claude Sonnet 3.7,第二阶段升级为 Claude Sonnet 4.0,后续又切换到 Sonnet 4.5,并增加了 CRM、改进库存管理、可通过浏览器进行更深度网页搜索等工具。结果显示,Claudius 的业务表现明显改善:更能进行诚信的商业交互、稳定找货、给出合理定价并执行销售,亏损周数也在第二阶段后期大幅减少;店铺地点也从旧金山扩展到 3 个——旧金山、纽约和伦敦。