AI 精选动态
智能评分 65
LocateAnything视觉检测模型
AI 推荐理由
并行解码边界框技术显著提升视觉定位效率,对AI机器人和智能体的实时感知能力有重要价值。核心解读
NVIDIA AI研究团队在CVPR2026会议上发布了LocateAnything视觉语言检测模型,该模型在HuggingFace上趋势排名第一。模型训练于138M高质量样本,采用并行解码边界框技术而非传统的一次一个坐标方式,提高了定位精度并大幅增加视觉定位和检测的吞吐量。