返回精选
AI 精选动态 智能评分 65

LocateAnything视觉检测模型

来源: twitter关注列表
作者: AK (@_akhaliq)
发布于: 2026-05-28
收录于: 2026-05-28
AI 推荐理由
并行解码边界框技术显著提升视觉定位效率,对AI机器人和智能体的实时感知能力有重要价值。
核心解读
NVIDIA AI研究团队在CVPR2026会议上发布了LocateAnything视觉语言检测模型,该模型在HuggingFace上趋势排名第一。模型训练于138M高质量样本,采用并行解码边界框技术而非传统的一次一个坐标方式,提高了定位精度并大幅增加视觉定位和检测的吞吐量。
#研究突破#模型发布#智能体