加密知识一站通
行情·工具·策略

通义上线Fun-ASR1.5,主打方言识别

动察 Beating 监测,通义实验室 4 月 20 日发布语音识别模型 Fun-ASR1.5,并已在阿里云百炼上线 API、在魔搭社区开放在线体验。官方称,这一版用单模型覆盖 30 种语言、汉语七大方言体系和 20 多种地区口音,不再按方言单独切模型。

通义给出的内部评测显示,典型方言场景的字错误率较上一版相对下降 56.2%,已有 5 种方言准确率超过 90%,15 种超过 80%。古诗词识别也被单列出来做了专项优化,官方给出的内部字符级准确率是 97%。这些数字都来自通义自测,不是第三方基准。

中文语音识别里最难处理的方言长尾,开始被收进同一套可直接商用的能力。对教育直播、地方政务热线、采访整理这类场景来说,接入方不用再按地区口音拆多套识别链路,部署会简单一些。

赞(0)
未经允许不得转载:币须知道 » 通义上线Fun-ASR1.5,主打方言识别

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址