加密知识一站通
行情·工具·策略

500万参数打平十亿级大模型:百度PaddleOCR超越Tesseract登顶GitHub OCR第一

1M AI News 监测,百度飞桨开源 OCR 工具库 PaddleOCR 以 73,300 GitHub 星标超越谷歌维护的老牌 OCR 引擎 Tesseract(73,200),成为 GitHub 上星标最高的 OCR 项目。排名第三的 MinerU 为 57,500 星标。PaddleOCR 于 2020 年开源,支持 100+ 语言,覆盖 160+ 国家和地区。

PaddleOCR 近期密集更新,上周发布的 PP-OCRv5 仅 500 万参数,在标准 OCR 基准上达到与十亿参数级视觉语言大模型相当的精度;PaddleOCR-VL-1.5 在文档解析基准 OmniDocBench v1.5 上以 94.5% 准确率刷新纪录。

赞(0)
未经允许不得转载:币须知道 » 500万参数打平十亿级大模型:百度PaddleOCR超越Tesseract登顶GitHub OCR第一

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址