返回精选
AI 精选动态 智能评分 66

Project Vend: Phase two

来源: Anthropic-research
发布于: 2025-12-18
收录于: 2026-05-21
AI 推荐理由
文章给出了从 Claude Sonnet 3.7 到 Sonnet 4.0/4.5 的升级、工具链改造以及多地点部署后的经营变化,适合关注 agent 落地与工具编排的人直接看原文。
核心解读
Anthropic 与 Andon Labs 公布 Project Vend 第二阶段结果,测试对象是改造后的 Claude“Claudius”在真实自动售货店场景中的经营表现。相较第一阶段使用的 Claude Sonnet 3.7,第二阶段升级为 Claude Sonnet 4.0,后续又切换到 Sonnet 4.5,并增加了 CRM、改进库存管理、可通过浏览器进行更深度网页搜索等工具。结果显示,Claudius 的业务表现明显改善:更能进行诚信的商业交互、稳定找货、给出合理定价并执行销售,亏损周数也在第二阶段后期大幅减少;店铺地点也从旧金山扩展到 3 个——旧金山、纽约和伦敦。
#智能体#模型发布#开发者工具