你知道吗,每个人说话时的语声都是独一无二的。在很熟悉的人之间,可以只听声音而相互辨别出来,如果用电声学仪器来测绘声波频谱,那么每个人的声波频谱都不一样。这就是声纹。
现代科学研究表明,声纹不仅具有特定性,而且有相对稳定性的特点。成年以后,人的声音可保持长期相对稳定不变,无论讲话者是故意模仿他人声音和语气,还是耳语轻声讲话,即使模仿得惟妙惟肖,其声纹却始终不相同。
可不可以利用声纹的这种独特性来做些身份鉴别的事情呢?比如,定制一款hei Siri神马的。
但是要想准确分辨声音特征却并非易事。首先,声纹识别系统性能会受说话者发声状态影响,说话者的身体状况、情绪等都会影响识别准确度。其次,环境的嘈杂度,以及采集、传输音频的硬件配置,都会在不同程度上对识别系统造成干扰。
好消息是,国内语音 AI 领军企业云知声率先攻破了这一难点。近日,云知声与医疗健康生态平台平安好医生共同研发的“声纹登录系统”(又称声纹锁)经过多次模型优化和升级迭代后,登录成功率接近 99%,达行业一流水准。
据悉,云知声声纹技术团队先后攻破了语音信号前端处理技术、信道处理、声纹识别等复杂技术。其产品可准确地捕捉到人声并进行背景噪声消除,同时,基于云知声超算平台和海量声纹训练数据,使得其算法模型得以学习到数万说话人、每人多种发声的特性,在AI的助力下,使得声纹识别效果越来越好。
此次推出的声纹登录系统只是声纹应用案例之一。也许在未来,付款可以不输入密码、不用指纹,而只要说一句“付钱吧”。
作者:金婉霞
编辑:李晨琰
责任编辑:唐闻佳
*文汇独家稿件,转载请注明出处。