图片作者:宗怡婷
随着3D手动交互设备LeapMotion的面世,人们开始预测“鼠标+键盘”的传统人机沟通方式何时会被取代 让机器读懂你的手势
本报记者 叶松亭 编译
有人说,最伟大的计算技术是“消失的技术”,它们从视线中消失、融入日常生活用品,让人们感觉不到计算的存在。眼下,借助体感设备,属于“消失的技术”的时代正在来临——
假如有一天,家里各种电子电器设备突然会“揣摩人心”、开始主动“关注”我们的一举一动,那该是个怎样的场景?打个响指,头顶的灯亮了;指指电视,自动切换下一个频道……人们就像是有了远程控制物品的超能力,不需要再挪开沙发上的靠垫,寻找遥控器又被扔到了哪个角落。
一直以来,人类和计算机的重要区别之一就是,人们会综合考虑各种可能,然后在自己的认知范围内做出最合适的反应;而计算机只会一问一答,不会多也从来不会少,精确但死板。
不过,在体感设备和诸多传感器的帮助下,眼下这种情况已开始渐渐变化。作为我们忠实而敏感的助手,体感设备会帮助计算机捕捉、解读我们的每个动作,并做出相应的反映,通俗点说,未来我们可以直接用肢体语言和计算机交流了。
“黄金组合” 地位难动摇?
放在几十年前,人们还无法想象自己可以脱离外接仪器与电脑相连。毕竟,我们已经使用键盘和鼠标与电脑沟通了几十年,计算机给我们的反馈从黑色屏幕上闪动的白色或绿色字符,变成了绚烂的图案和动听的声音,而我们给计算机下达的指令,也从由长串字符组成的文字命令,简化成了鼠标的轻轻点击。
然而,在这个变化越来越快的时代,还有没有更好的人机对话方式?
此前,人们一度将希望寄托在触摸屏上。
触摸屏和鼠标一样都是定位设备,区别在于前者根据电信号或超声波、红外线信号的变化来侦测用户手指的位置,从而实现与鼠标类似的效果,并且能够更好地获得显示与输入功能的平衡。
但很快,人们发现触摸屏暂时无法淘汰键盘。因为键盘是人们迄今为止发明的与计算机对话最便捷的设备,其灵活性和速度是其他设备无法比拟的。相比之下,语音识别准确率太低,手写输入太慢,至于触摸屏,由于感觉不到按键的按下和弹起,总像是少了点什么,不信可以试着在iPad上用word文档写篇千字文。
触摸屏的这个问题并非不能解决。据报道,苹果早在2008年就申请了一项专利,提出一种带有力反馈功能的触摸屏,按在触摸屏上,感觉像是按在柔软的鼠标垫上。诺基亚也在这个领域投入了不少资源,甚至开发出了能够模拟物理材质的触摸屏原型,如果屏幕上显示一块石头,触摸屏摸起来就像是一块石头。这些专利和原型为触摸屏的下一步发展带来了曙光,也许再经过一段时间的发展,就能有更大的突破。
不过,即便日后触摸屏的手感能做得和键盘一样好,也不代表人们和计算机对话的方式发生了革命性的改变。事实上,触摸屏可以看成是鼠标、键盘和显示器的“三合一”,传统观念认为,在真正高准确率的语音识别技术诞生前,鼠标、键盘这对“黄金组合”的地位很难动摇。
计算机用户界面过时了?
这种传统观念,自Wii和Kinect问世后,被慢慢改写了,至此,人们终于可以从椅子上站起来,离开传统人机交互设备了。
2009年,麻省理工的科研人员开发了一套由手机、摄像头和微型投影仪等集合而成的装置,叫“第六感”,可以把任何地方变成显示设备和输入设备。
例如,当用双手比划一个取景框姿势的时候,它会自动拍照;当用手划过一页文件时,它会自动把文件转成电子版并用投影仪播放出来;当拿起一本书,它会投影出这本书在网上书店中的得分;当拿起一盒麦片时,它还会显示相关的营养成分和在网店里的价格。
为何“第六感”如此“积极”?因为它的计算逻辑和其它计算机不同。传统计算机只会接受在指定地方的指定输入,对周遭其它刺激完全“无视”,“第六感”则会主动探寻用户想法并使其实现。
几个月前,3D手动交互设备“LeapMotion”也问世了。将它连上电脑,能形成一个约0.25立方米的探测空间,在此空间内,用户手上所有的动作都可以被精确捕捉,精度高达1/100毫米。
和Kinect不同,LeapMotion专为计算机设计。研发人员表示,在高精度体感设备的帮助下,传统的计算机用户界面已经过时了,“我可以靠直觉来做操作,机器会理解我的想法。”而且,只要软件支持,这种体感设备允许用户直接用手在三维空间中操作数据,旋转、放大、缩小、拉长或者压扁。
而就在约三周前,苹果确认以3.6亿美元收购曾参与Kinect研发的以色列3D传感器技术公司PrimeSense。业内普遍认为,是这家公司去年推出的世界上最小的3D传感器芯片Capri打动了苹果。据悉,Capri能够探测的深度是之前处理器的3倍,尺寸仅有原来的1/10,对自然光的抗干扰能力是原来的20倍,在白天日照下也能正常工作。
业内人士认为,苹果收购PrimeSense后,AppleTV将获得“杀手级”技术支持,用户未来无需依靠Kinect这类设备,就能够对着电视机实现各类体感操作或体感游戏。
动作捕捉技术各有利弊
其实,不管是“第六感”或Kinect,从技术层面讲,这些体感设备捕捉人类动作时用的都是“视频捕捉技术”。
这项技术的原理其实是模仿人眼,利用空间两个摄像头,对比在某一时刻所拍摄的两帧影像,完成对捕捉对象的识别、定位。基于视频捕捉的动作捕捉系统优点十分明显,它采用仿生学原理,对运动对象没有限制,硬件成本相对低廉,实时性表现也很优异,但其无法忽视的缺点是,精度相对不高。
除了视频捕捉技术,目前主流的动作捕捉技术还包括光学式、机械式、电磁式和声学式四类。
光学式动作捕捉是目前应用较为广泛的技术,主要原理是利用分布在空间中固定位置的多台摄像机,捕捉对象身上特定的标记点(Marker)。但由于运动中各标记点容易互相遮挡,光学式动作捕捉的最大缺点是对环境要求较高、且容易造成误采,因此动作捕捉常限定在室内,同时需要人工后期介入处理数据。
典型的机械式动作捕捉系统则由多个关节和刚性连杆组成,借助安装在各个关节处的角度传感器,完成各时刻的关节形态的采集,以此重绘出该时刻被捕捉对象的形态。
机械式动作捕捉不受自然环境限制且精度高,由于动作捕捉模块相对独立,还可以同时捕捉多个对象。不过,披上这套设备,就像在捕捉对象身上加装了一层外骨骼,对动作幅度的限制较大,使用不方便。
至于其他两种技术,电磁式动作捕捉系统要求捕捉对象佩戴传感器在特定的电磁场中运动,并通过传感器切割磁感线完成捕捉,为了减低抖动和干扰对动作捕捉的影响,一般采样频率被限定在15HZ左右,因此捕捉高速运动时容易失真。而声学式动作捕捉系统则利用了具有良好穿透性的超声波,但容易受空气温度、湿度及气压等因素影响,需要对结果做进一步修正。
用途广泛的体感装置
越来越多体感设备出现的同时,也带来一个问题,除了手舞足蹈地玩游戏、看电视,体感设备还能怎么用?
一种深受爱美人士欢迎的用法是:综合运用增强现实(AR)技术和体感设备,建造可快速更衣的虚拟试衣间。
在莫斯科就有一间这样的试衣间,使用体感设备捕捉用户体态,随后再利用AR技术结合现实环境和虚拟衣帽饰品等搭配,实现虚拟试衣镜,为购物的客人提供最便捷的换装和试穿体验。客户只要对自己感兴趣的衣服比个手势,显示器上就会显示客户穿上这套衣服后的3D着装效果。
体感设备在3D建模方面也大有用处。
在国外一项街头试验中,实验方现场架设了3台Kinect,被试只要站在一个台子上完成扫描建模,与体感设备联接的3D打印机就能迅速打印一个被试的迷你雕塑。而考虑到Kinect具有测量外界环境的能力,它还能被安装在机器人身上,在危险地区或恶劣环境中进行一些不需要很高精度的测量与勘察作业。
医疗领域是体感装置的下一个用武之地。华盛顿大学的科研人员已尝试让外科医生使用体感设备,远程控制机器手臂执行手术。从理论上说,这套设备完全适用于救灾或战场,但就目前来说,由于外科手术对精确度要求非常高,现有体感设备的精确还需要进一步提高,这套系统也尚属于试验阶段。
医疗领域还有一个看起来比较另类的用途是,用于有关精神疾病康复的项目研究。据BBC报道,美国南加州大学一个科研小组,利用体感设备,构建了一套名为“虚拟治疗师”的辅助系统,帮助那些患有精神疾病但不愿接受面对面诊疗的病人。
“虚拟治疗师”可以通过体感设备“观察”和收集治疗对象的身体和面部细节动作,比如眼神、笑容等,还能持续记录被观察者的数据,然后将这些数据与资料库进行比对,从而对一个人是否患有抑郁症、焦虑症以及创伤性精神障碍做出辅助性判断。研究小组目前已经采集了数百名军人的数据,并将这些数据整理成资料库。该资料库将在未来对于士兵是否患有战争创伤性精神障碍的诊疗过程中发挥作用。