返回精选
AI 精选动态 智能评分 69

NuExtract3

来源: twitter关注列表
作者: ModelScope (@ModelScope2022)
发布于: 2026-05-25
收录于: 2026-05-25
AI 推荐理由
适合关注文档智能与结构化抽取的团队,值得点开原文查看模板生成和推理模式设计。
核心解读
NuMind 发布 NuExtract3,一款专门用于文档理解的 4B vision-language model。它支持从扫描件、收据、表单、发票、合同和表格中按 JSON 模板抽取结构化结果,也可将文档图像转换为包含 HTML 表格和 LaTeX 公式的 Markdown。该模型在结构化抽取基准上优于 gemma-4-E4B-it、Qwen3.5-9B 和 GLM-4.6V-Flash,并且失败更少、推理 token 更少;同时支持 thinking 和 non-thinking 两种模式、可根据自然语言自动生成抽取模板,并支持多语言以及 vLLM + Transformers。
#模型发布#多模态#开发者工具