人有七情六欲、喜怒哀乐,这些都是情绪,情绪最直观的体现就在人的脸上,但表情在人的脸上并不会长期驻留,往往是一闪而过。
现实生活中,有些人是情绪盲,不能洞察别人的情绪,甚至连自己的情绪变化也不知道。
洞察情绪,在传统中国,被认为是一种非常高明的智慧,古代人把这种能力概括为4个字:察言观色。
那么进入大数据时代,我们是否能够通过处理数据来掌握这门技能呢?
人类表情能分析吗?
当然可以。
最早对人类表情进行分析的是达尔文和高尔顿。在他们的时代,照相的技术开始普及,出现了大量的人脸照片。
达尔文在进行了人脸对比研究之后,得出结论说,人类的表情是天生的、共通的、跨种族跨文化的。
达尔文
高尔顿也有一个重要的发现,人类最漂亮的脸是平均脸,所谓平均脸,是指从一定数量的普通人脸中提取面部特征,根据测量数据求平均值,再合成一张脸,这就是人世间最漂亮的脸。
高尔顿当年没有计算机,他的办法是照片叠加,你可以想象,他得出这个结论琢磨了多少张照片。
高尔顿
达尔文的观点在其后一百年并不受待见,绝大部分人类学家、心理学家都认为人的表情是从社会文化和社会交往当中学习而来的,不同文化背景的人有不同的表情,每个人对表情的解读都是在特定的文化情境中发生的。
一个比较雄辩的例子是,不同文化背景的人看到相同景象的时候,会产生不同的表情。
有心理学家做过实验,美国人和日本人一起观看电影,在出现恐怖、惊悚等刺激的镜头时,日本人会比美国人更多地用微笑来掩饰自己负面的情绪,场景相同,表情不同,这就证明了文化对人的表情有决定性的影响作用。
一张脸就是一块皮,既然人类的表情没有共通性,那就更谈不上对皮肉之下真正的情绪进行解读了。
但这一切被美国心理学家埃克曼扭转了。虽然前人已经做过实验,但埃克曼自己又做了一遍,他发现:
埃克曼
这是因为前人的实验设计有问题,他们让两国的观众坐在一起,日本人比较顾及他人的感受,所以会掩饰自己的表情,而如果让日本人单独看电影,日本人就会表现出真实的表情,而这种表情,无论是日本人还是美国人都是相同的。
此外,埃克曼发现,一个出生时就失明的盲人也会有表情,而且这些表情和其他人的表情高度相似,当然盲人的表情绝对不是通过视觉学习和社交生活获得的,这令埃克曼相信,表情是人类共通的,是人类进化的结果。
量化表情?从43块肌肉说起
既然人类表情是共通的,埃克曼就决心找出量化和测量表情的客观方法。
要量化表情?这在当时,是一个听起来几乎无法完成的任务。
每个人都有一张脸,但这世界上,没有两张脸完全相同,人脸又是动态的,几乎人类所有的情绪变化都可以通过脸部的细微变化传达出来,人脸太神秘了。
正是因为这种多样性、丰富性和复杂性,人脸从来不是科学家的“菜”,人脸一直是艺术家的领域,从埃及最早的狮身人面像到达·芬奇的《蒙娜丽莎》、蒙克的《呐喊》,再到各种摄影艺术作品,人脸是古今中外艺术家永恒的主题。
埃克曼首先从解剖学出发,确定了人类面部一共有43块肌肉,他把每一块肌肉视为一个面部的动作单元,人类所有的表情都可以被视为这43种不同动作单元的组合,如果每一个组合都对应一个编码,那这些组合就形成了一个“面部表情编码系统”。
对每一种表情,埃克曼不仅将其分解为不同肌肉动作单元的组合,赋予它一个特定的编码,还配上对应的照片和文字说明。埃克曼和他的同事用了整整8 年的时间创建这个表情编码系统,这个系统也可以被理解为一个表情数据库。
这套编码系统一推出,就被电影、动画片的制作公司采纳,被视为指导演员脸部表演、设计动画人物表情的宝典,这个数据库非常管用,凭借它,埃克曼开创了人类心理学历史上的诸多传奇。
进入智能时代之后,埃克曼创建的“面部表情编码系统”也成了人工智能表情识别的基础,埃克曼本人早在2004年就曾经预言:
“5年之内,面部表情编码就会成为一个自动系统,当你跟我说话的时候,一个摄像头会看着你,它会立即读出你情绪状态的瞬间变化。”
埃克曼明确了产生人类表情的规则,把关于表情的隐性知识上升为显性知识,把它变成了一门“显学”。
只要具备清晰的规则,计算机就可以理解并模仿人类表情。事实上,和人类相比,机器解读表情更有优势,埃克曼所定义的微表情,通常是一闪而过的。
我们还会脸红,会心跳加速,身体会微微出汗,姿势会微微颤动,这些普通人用肉眼都难以发现,但在一个由数据、计算和模型统治的世界里,摄像头可以又快又准地捕捉这样的变化。
可以预见,终有一天,计算机对表情的解读将比人类还要敏锐。
2010年起,全世界陆续有多个表情分析系统问世。
例如,加州大学圣迭戈分校研发的CERT(表情识别工具箱),可以自动检测视频流中的人脸,实时识别“面部表情编码系统”中的30个动作单元组合,包括愤怒、厌恶、恐惧、喜悦、悲伤、惊奇和轻蔑等表情。
经卡内基–梅隆大学和麻省理工学院联合检测,CERT的表情识别准确率达到了80.6%。除了被用于抑郁症、精神分裂症、自闭症、焦虑症等疾病的分析,这套系统还可以装在汽车上,监测驾驶员的疲倦程度,它还可以用于监测和照顾老年人。
毕竟,绝大多数人不会明确地说他们不开心或不舒服,但表情会透露他们的真实感受。
在分析解读的基础上,机器也可以利用43块肌肉组合的方法,再造和人类一样的表情,毕竟,埃克曼之前通过研究已经为人类3000多种有意义的表情总结出了清晰的编码和规则。
只要我们清楚地掌握一件事情的规则,人工智能就可以进行模拟和复制,这意味着,机器人未来一定可以具备和人类几乎一样的表情。
机器可以解读人类的表情,就意味着机器可以读懂人类的情绪和内心,理解部分人性,机器人还将具备和人类一样的表情,和人互动,人机交互的想象空间将骤然增大,未来的世界将相当狂野!
这狂野的未来完全符合逻辑。机器人的智慧来源于编码、量化和数据,只要在可以用逻辑、规则和数据表达的领域,机器人就会向人类逼近。换句话说,只要具备数商,机器人就会拥有智商和情商。
埃克曼被评为20世纪100位最伟大的心理学家之一,他其实算是一个高数商的代表。
2008年,埃克曼的工作和经历被拍成了电视剧《别对我说谎》。当我们读到埃克曼这样的伟大心理学家的故事时,不禁回肠荡气,惊叹于他对人类心理的理解,佩服他把表情这样人性化的领域变成一门量化、显性的科学。
这是人类科学进步的一个重要的表现:不断把时代的隐性知识转化为显性知识。一个高数商的人,就要具备这样的能力。
编辑:张子杰
责任编辑:李伶
声明:转载此文是出于传递更多信息之目的。若有来源标注错误或侵犯了您的合法权益,请作者持权属证明与本网联系,我们将及时更正、删除,谢谢。