■文汇报记者 沈湫莎
《连线》杂志主编凯文·凯利说,机器人真正的变革还没有到来,或许是因为人机交互的方式还没有彻底改变,大多数时候我们还需要通过打字或手写输入命令,如果机器人能听懂人话,世界将变成什么样?
昨天,21个项目获得了第四届“吴文俊人工智能科学技术奖”,其中上海交通大学和苏州思必驰信息科技有限公司合作开发的“面向口语教育的智能语音技术及云服务平台”获得进步奖二等奖,这个能听懂人话的平台以及背后携风雨之势而来的语音产业,或许预示着我们离“巨变”并不遥远。
互联网领域的“慢”行业
相比移动互联网行业的嘈杂,智能语音行业的发展简直可以用慢来形容,没有公关战、没有BAT领头、至今也没出现“船票”级产品。然而,上海交通大学智能人机交互研究所的研究员俞凯,前年在广东湛江做的一个试验,分明让人体会到了语音产业的进步。在这个实验中,一台机器人和几十位老师分成两组,分别为相同数量的学生的英语口语打分,结果显示,机器人打分抽查满意度98%,与教师组一致率为99.8%。
机器人的优势还在于速度,俞凯说,如果按湛江11.7万考生参加英语口语测试计算,需要100位老师忙活12天,但用上机器人,只要2天。
目前,能提供这项语音服务的除了俞凯所在的上海交大,还有脱身于中国科技大学的科大讯飞,后者作为中国最早出现的语音类企业,却没有及时发展成一家互联网企业,事实上,这个圈子中的大多企业主要营收仍然来自软件授权,因此这些年并没有出现爆炸式增长。
不过,中国工程院院士、中国人工智能学会理事长李德毅却直言,“慢”并不会持续太久,语音类产业必将迅速崛起,这是大数据的下一座“金矿”。
将出现颠覆性的成果
机器人是怎样为学生打分的?其实他们只是事先学习了各位老师的打分方法:将某位老师的全部打分记录灌入机器人的“大脑”中,它就能分析出这位老师的打分习惯,当机器人的“大脑”中存储了多位老师的“习惯”后,它就能代替老师打分了。
这个过程有点像某家语音企业让机器人“学习”了邓丽君的所有歌声,再以邓丽君的方式唱出新歌,又或者和英国影片《黑镜子》中的那样,当某人在社交网站上留下了足够多的可供“学习”的音频,当他去世后,他的家人就能用软件合成他的声音以供慰藉。
俞凯透露,仅就机器人英语能力评估领域,目前的市场规模就在十几亿,而在语言识别、合成以及情绪和重音的识别技术都已成熟的情况下,他正在努力开拓更多新市场。
让机器人更“人性化”
中国已成为世界最大的机器人市场,但去年也只销售了3万多台,新松机器人自动化股份有限公司总裁曲道奎说,工业机器人的市场其实有限,现在全世界的眼光都盯着家用机器人市场。
要让机器人走进家庭还得更“人性化”,除了更精准的红外定位、更灵敏的传感器外,语言识别是给人们带来良好体验不可或缺的因素。
俞凯在手机上打开他们研发的一款名为“语音输入板”的APP,当某人的话音刚落,语音就转换成文字在屏幕上显示出来,这款软件能够做到自动收集人们的表达习惯,从而形成更高的辨识度,当移植到机器人上时,机器人就能更好地识别主人的指令;另一方面,当越多人下载这款APP,收集到的语言信息形成的大数据平台,也将为后期的产品开发带来便利。