AI 精选动态
智能评分 64
Project Vend: Phase Two
AI 推荐理由
可重点看其对智能体落地的约束条件:仅靠更强模型不够,工具链、库存可见性和业务流程脚手架对真实任务表现有明显影响。核心解读
Anthropic 发布了 Project Vend 第二阶段实验,继续测试改造后的 Claude“Claudius”能否在真实商业任务中经营自动售货店。相比第一阶段使用 Claude Sonnet 3.7,第二阶段升级到 Claude Sonnet 4.0,后续又用到 Sonnet 4.5,并新增了 CRM、改进库存管理、增强网页搜索等工具。结果显示,Claudius 的业务表现明显改善:更能可靠采购、定价并完成销售,负利润周数大幅减少;同时门店从旧金山扩展到纽约和伦敦,总计 3 个地点,且旧金山还有第二台 vending machine。