AI 精选动态
智能评分 65
开源免费本地OCR本地工作台
AI 推荐理由
提供零依赖跨平台本地 OCR 工作台,包含多规格模型和评测能力,可能替代依赖云端 API 的替代方案核心解读
Berryxia.AI 发布 PP-OCRv6 开源本地工作台,支持 1.5MB 到 34.5MB 三种模型规格,通过 CoreML 加速本地跑,零依赖支持 Mac、Intel、Linux 以及浏览器端,包含图片批量处理、多格式导出和跨平台评测脚本
全文
兄弟们,肝出来了!并且全部免费开源了!
我把PP-OCRv6直接做成了本地工作台,在Mac上用CoreML加速,一键就能切换Tiny、Small、Medium三个模型大小!
Tiny只有1.5MB适合极致轻量,Medium 34.5MB主打精度,中间Small做平衡。
支持图片上传、批量处理、结果导出CSV/Markdown/Excel,历史记录自动保存。
整个东西完全本地跑,隐私安全,不用上传任何数据。
最爽的是在苹果硅上自动开启CoreML加速,Intel Mac和Linux也能CPU跑。
还专门做了浏览器版Tiny模型,零依赖直接在网页里就能用OCR。
附带评测脚本,能跟OmniDocBench和macOS自带Apple Vision对比,实际测试在弯曲表面、点阵字体、低对比度这些难搞场景表现都不错。
以前做本地OCR最烦的就是模型下载、环境配置、精度和速度权衡,现在我把这些全封装好了。
开发者、研究者、需要离线处理文档的人直接clone就能用。
这其实是我自己日常做OCR时踩了很多坑后,顺手做的东西。
希望能帮到同样有这个需求的朋友。
https://video.twimg.com/amplify_video/2067082101636411392/vid/avc1/1872x1080/4XvOeE4tN2nD8uxY.mp4?tag=28
> **引用原帖 Berryxia.AI (@berryxia):**
> https://t.co/0MZGG32B8D
> https://x.com/berryxia/status/2067078380017828205