AI 精选动态
智能评分 60
LandingAI 发布 Agentic Document Extraction Skills
AI 推荐理由
与常规 API 文档方案相比,新增了与 Coding Agents 直接集成的技能接口,可显著降低文档处理流水线的开发成本,值得关注。核心解读
LandingAI 将 Agentic Document Extraction 升级为 Agent Skills,为 Claude Code、Cursor 等 Coding Agents 提供可直接调用的文档处理流水线。包含两个 Skill:document-extraction 支持文档解析、结构化 JSON 提取、按页分类、目录生成、大文件异步处理(约 1GB/6000 页)及视觉定位;document-workflows 提供并行批处理、混合文档流水线、RAG 准备、导出 DataFrame/CSV/Snowflake 及可视化标注等功能。
全文
LandingAI 把 Agentic Document Extraction 从「API 文档 + 手写脚本」升级成 Agent Skills ——让 Codex、Claude Code、Cursor 等 Coding Agents 在对话里直接写出可用的文档处理流水线
https://t.co/4NRiQr6co3
# 两个 Skill 的分工
1. document-extraction — 原子操作
· Parse:结构化 Markdown + 层级 JSON
· Extract:JSON Schema / Pydantic 字段抽取(发票、表单、表格等)
· Split:混合批次按文档类型拆分
· Classify:按页分类路由(Preview)
· TOC:生成目录结构(Preview)
· 大文件:异步处理(最高约 1GB / 6000 页)
· Visual grounding:元素级坐标与置信度
2. document-workflows — 生产级组合
· 并行批处理(ThreadPool / async)
· Classify → Extract 混合文档流水线
· RAG 准备:语义分块、embedding、ChromaDB/FAISS
· 导出 DataFrame / CSV / Snowflake
· 可视化标注(bbox 叠加、词级高亮)
· Streamlit 交互 UI

> **引用原帖 LandingAI (@LandingAI):**
> Turn Claude Code into a Document Processing Agent!
> We just released Agentic Document Extraction (ADE) skills for AI coding agents. Install them in Claude Code, Cursor, or any AI coding agent that supports the Agent Skills convention.
> The skills help you incorporate ADE into your document processing workflows directly from your coding environment.
> Two skills are included - document-extraction for core operations and document-workflows for end-to-end pipeline patterns.
> The skills include guidance and patterns for dependency installation, API client setup, and error handling, so your agent handles these for you.
> Install on Claude Code:
> /plugin marketplace add landing-ai/ade-document-processing-skills
> /plugin install ade-document-processing@ade-document-processing-skills
> https://x.com/LandingAI/status/2066831209112752255