AI 精选动态智能评分 65

LocateAnything视觉检测模型

来源: twitter关注列表

作者: AK (@_akhaliq)

发布于: 2026-05-28

收录于: 2026-05-28

AI 推荐理由

并行解码边界框技术显著提升视觉定位效率，对AI机器人和智能体的实时感知能力有重要价值。

核心解读

NVIDIA AI研究团队在CVPR2026会议上发布了LocateAnything视觉语言检测模型，该模型在HuggingFace上趋势排名第一。模型训练于138M高质量样本，采用并行解码边界框技术而非传统的一次一个坐标方式，提高了定位精度并大幅增加视觉定位和检测的吞吐量。

#研究突破#模型发布#智能体