病源追溯、罪犯追踪、寻找走失儿童……作为人工智能(AI)的关键应用,人脸识别技术正在各行各业扮演着重要角色。从茫茫人海中识别出那个关键的“他”,其前提是要有一张清晰的人脸图像,可如果只有人的背影呢?
最近几年,人工智能视觉识别领域兴起了一项名为“行人重识别(ReID)”的前沿技术研究,科技界和产业界试图绕过人脸,转而通过步态、体态、衣着等其他个体特征实现对人的精准识别。近日,上海人工智能独角兽企业依图科技在ReID领域取得新突破,其算法刷新了全球工业界三大权威数据集业内最优成绩(SOTA),达到业界迄今最高标准。
事实上,自2017年起,随着人脸识别技术的日臻完善,以苹果公司FaceID为代表的“刷脸”应用迅速商业化普及。如今,刷脸支付、刷脸乘车已渗透到人们的生活日常。业内专家认为,伴随着技术性能突破,ReID算法将成为计算机视觉识别领域的下一代“杀手级应用”,一波新场景、新业态正在由它“解锁”。
AI视觉识别领域补上一块重要“拼图”
99%,是2018年全球人脸识别技术千万分之一误报下的识别准确率的最高水平,尽管精度在不断提高,但上升空间已然有限。然而,在交通运输、工业制造和城市规划等实际应用场景中,99%的图像都是不含人脸或人脸部分是极其模糊的,因此业界对“不看脸”的识别需求呼声越来越高。
可是,不看脸怎么认出谁是谁呢?视频结构化描述专家胡传平说,除了脸部特征之外,步态、身形、服饰等特征也可用来识别人,利用这些生物特征识别人的技术被称为ReID。大约四五年前,该技术刚刚兴起,如今逐渐趋于成熟。
尽管人脸识别和ReID都需要比对生物特征,但两者的关注重点并不相同。简单来说,人脸识别的原理是将人脸图像或视频信息与数据库中的信息相比对,最后锁定人物,这是一种偏静态的识别;而ReID则需要先从前后多张关联照片中识别出人物的特有行为,再寻找出与此特征相匹配的那个人,是一种动态识别。从某种意义上说,ReID是人脸识别的“进化版”。
优化算法算力,加速新技术商业化落地
然而,ReID“寻人”并不容易,面临着许多难题。由于不同画面中人物的姿态、行为甚至外观(比如: 正身、侧身、背身)会发生较大变化,不同时间、场景的光照、背景和遮挡物各不相同,这些都对ReID技术提出了极大挑战。胡传平说:“无论从计算量还是识别难度来看,ReID都要高于人脸识别。”
▲受访者供图
“首位命中率”和“平均精度均值”是业内评判ReID算法好坏的两大关键指标。“如果以寻找伴侣作为比喻,‘首位命中率’是你一下子看到两人身上最合得来的那一点,速度定夺是否匹配,‘平均精度均值’则是在一段实际的生活相处中,从两人的观念、习惯、兴趣等多方面来判断是否选择这个人。”依图科技相关研发人员这样解释。
近日,依图科技在全球权威的三大数据集上将这两大关键指标下的六个项目数据全部提升,进一步稳固了中国技术团队在该领域的领跑地位。
除了算法复杂,ReID在实战场景下的另一个难题便是算力,它需要更高效的芯片作为机器大脑的支撑。为此,依图科技于去年5月发布全球首颗云端视觉AI芯片“求索”,单路摄像头功耗不到1瓦,借此为ReID的商业化落地提供强大算力。
跨时空对比,新场景、新机会正在“解锁”
据了解,依图在工业界落地的ReID项目的规模与问题的复杂程度,已远超学术界的最高水平。在实战应用中,仅凭穿着、体态特征,依图已能将ReID做到2017年-2018年人脸识别的精度。
不妨做一个跨时空对比——2017年的人脸识别技术已相当完善,以苹果公司FaceID为代表的“刷脸”应用竞相商业化,并在两三年内迅速普及。因此,不少业内人士认为,当ReID算法与芯片的成熟度接近或达到当年人脸识别技术的程度时,再加上高智能密度的AI芯片“加持”,计算机视觉识别领域的下一个“杀手级应用”即将到来,而今,距离其大规模商业化并不遥远。
一个经典应用场景是:假如孩子在街道上走失,即使摄像头没有捕捉到孩子的样貌,AI照样可以找到他的去向,从而挽救一位绝望的母亲。而另一个影响深远的产业将是家庭机器人,因为家庭机器人很难实时看到主人的脸,如果能够通过衣着或者步态识别主人,机器人则能够更加“体贴”地为人们提供服务。
“短短几年,业界利用人脸识别技术解锁了如此多的新应用,现在,通过背影即能达到和人脸识别相似的效果,有理由相信,ReID技术的应用前景未来可期。”胡传平说。
作者:沈湫莎
编辑:储舒婷
责任编辑:任荃
*文汇独家稿件,转载请注明出处。