加密知识一站通
行情·工具·策略

Liquid AI开源小体量多模态模型:在端侧直接将图片提取为JSON结构化数据

动察 Beating 监测,Liquid AI 开源了两款小体量多模态模型 LFM2.5-VL-1.6B-Extract 与 LFM2.5-VL-450M-Extract。新模型专门针对图像结构化数据提取进行了优化,能够根据用户指定的字段列表,直接在设备端将图片转换为 JSON 格式的数据,省去了传统多模态模型生成全文后再进行二次解析的步骤。

新模型提供 16 亿(1.6B)与 4.5 亿(450M)两种参数规格,采用 LFM Open License v1.0 协议发布。官方评测显示,新模型在文档扫描、车载客舱理解及工业检测等场景中表现优异。在基准评测中,1.6B 模型性能可抗衡 40 亿(4B)级别的通用多模态模型,450M 模型则可媲美 20 亿(2B)级别模型。

在部署层面,新模型针对各类智能硬件与边缘设备芯片(SoC)进行了适配,可在车载客舱理解、文档扫描和工业检测等端侧场景中进行离线部署。Liquid AI 现已在 Hugging Face 平台开放了模型权重的下载。

赞(0)
未经允许不得转载:币须知道 » Liquid AI开源小体量多模态模型:在端侧直接将图片提取为JSON结构化数据

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址