2.16%的超低错误率!近日,喜马拉雅自动语音识别技术(简称“ASR”)在SpeechIO TIOBE评测中荣获第一名。
SpeechIO TIOBE评测是国内较为权威的行业公开评测项目,旨在客观评估并记录各个公共语音识别服务在不同领域的识别准确率,以字准确率为测试指标。
ASR技术是喜马拉雅智能语音实验室所研发的一项重要语音技术,可对平台中无文稿的声音内容进行语音转写,并输出相应的文字,从而便于听众更好地理解声音内容。实验室基于WeNet开发了自研的“端到端”语音识别框架,并在数据读取、模型结构、训练方式、热词增强、部署流程等全链路进行深度优化,不断尝试新的论文方案,融合吸收到自研框架当中,有效降低错误率,达到行业领先水平。
对于已有原始文稿的声音内容,AI文稿功能则应用超长音频与文本的对齐技术,将声音与文稿进行时间戳对轨。声音播放的同时,相应文字同步高亮显示,提升听众体验,用技术加持声音、用声音服务生活。
作者:付鑫鑫
编辑:赵征南
责任编辑:范兵
*文汇独家稿件,转载请注明出处。