人脸识别之后的下一个风口是什么?业界对此早有共识——自从AI(人工智能)的人脸识别能力超越人类,学界业界目光逐渐转向另一个更具科研意义和应用价值的方向——行人重识别(Person Re-identification,ReID)。
简单说,行人重识别,就是在“不看脸”的情况下,通过步态、体态、衣着完成对人的识别。这种技术的一个关键应用场景就是:假如孩子在街道上走失,那么,即使摄像头没有捕捉到孩子的样貌,AI照样可以找到他的去向,从而挽救一个绝望的母亲。
近日,依图科技在ReID领域取得新突破,刷新业界三大权威数据集当前最优成绩。同时在实战应用中,仅凭穿着、步态特征,依图已能将ReID做到2017年~2018年人脸识别的精度。
事实上,2017年的人脸识别技术完善度,导致以以苹果公司FaceID为代表的商业化迅速普及;2年后,支付、乘车时刷脸已渗透到日常生活的每个角落。因此,有理由相信,ReID算法即将成为计算机视觉领域的新一代“杀手级应用”,新场景、新机会已经解锁。
行人重识别(ReID),人脸识别后的“杀手级应用”
在交通运输、工业制造和城市规划等实际场景下,99%的图像都是不含人脸或人脸部分是极其模糊的,仅有几个像素大小,这时候人脸识别的作用较为有限。
行人重识别(ReID,也称“行人再识别”),是指在多摄像设备网络下对行人进行检索,利用步态动作、身体特征等更为全面的信息来识别人物,无论单独使用还是与人脸识别相结合,都能发挥更大的应用价值。
除了智能零售、智慧交通、智能城市等经常提及的应用场景,ReID技术的应用也将使日常生活更加便捷:游乐园更易寻找走失儿童、宠物/家庭机器人可以凭背影准确识别主人或顾客并提供相应服务。
然而,由于ReID需要从不同摄像机拍摄的图像或视频中找出同一个人物,而这些摄像机所覆盖的范围彼此并不重叠,导致缺乏连贯的信息,而且不同画面中人物的姿态、行为甚至外观(比如: 正身、侧身、背身)会发生较大变化,不同时间、场景的光照、背景和遮挡物各不相同(背景中常还有体型、衣着相似的其他人物干扰),摄像机的分辨率也有高有低,人物在画面中出现的位置有远有进,这些都对ReID技术提出了极大的挑战。
深度优化ReID算法框架,AutoML取代人工算法调优
凭借自身工程与研发实力,依图科技深度优化了ReID算法框架,显著提升了算法效率,通过结合AutoML等前沿技术,进一步创新性地实现了模型参数的自动搜索与迭代。
此次在业界最具影响力的三大ReID数据集Market1501、DukeMTMC-ReID、CUHK03上,依图科技将衡量算法性能的两大关键指标“首位命中率”(Rank-1 Accuracy)及“平均精度均值”(Mean Average Precision,mAP)6项数据全部提升,充分显示了依图的技术实力,进一步稳固了中国技术团队在该任务下领跑地位。
需要说明的是,Rank-1命中率高,只意味着算法能够在众多图像中准确找出最容易识别或者说匹配的那张,并不能反应模型的真实能力,尤其是应对复杂场景的表现。因此,评价ReID算法性能时需要结合mAP值,它反映的是系统的综合检索性能。mAP值越高,说明系统的实用性越好,既能查得全也能查得准,能够较好地应对多遮挡、光线暗、画面模糊等情况。
算法+算力,加速ReID商业化落地加速
面对又一项业界纪录,依图团队表示,事实上,他们在工业界实战落地的ReID项目,其规模与问题的复杂程度已经远超三大数据集,学术界现有的ReID基准已经无法体现工业界算法的最高水平。
Market-1501在清华大学内采集,行人(ID)基本上是穿短袖、短裤和裙装的亚洲人;DukeMTMC-reID在杜克大学内采集,ID主要是身着冬季服饰的欧美人。和这些在特定场景,特定时间段采集的数据相比,在真实场景下ReID算法需要做到在跨时间段,跨场景,跨不同成像质量的图像采集设备下进行高精度的快速识别, 其数据分布远远与问题复杂程度远远大于现有的学术数据集。对此,依图科技的团队认为,业界需要更好的ReID数据集,也需要更全面的算法衡量数据集,至少对于商业化落地的算法是如此。
实战场景下的ReID任务,不仅对算法提出更高要求,也需要更高效的芯片提供强大的算力支持。目前看来,依图是当下同时具备算法和算力能力的公司,去年5月它发布的QuestCore(求索)芯片是全球首颗云端视觉AI芯片,提供强大算力,单路摄像头功耗不到1瓦。
在ReID实战应用中,依图研发人员进一步优化算法,依托自研AI芯片,仅凭穿着、步态特征,已能将ReID做到2017年~2018年人脸识别的精度。不妨做一个跨时空对比——2017年,人脸识别的技术完善,迅速普及了商业化应用,尤其是以苹果公司的FaceID为代表;到如今,支付、乘车时刷脸已渗透到日常生活。
因此,有理由相信,当ReID算法与芯片的成熟度也达到当年人脸识别的程度时,业界期待的下一个计算机视觉领域“杀手级应用”已经到来,其大规模商业化即将落地,新的应用场景已经解锁。
作者:张懿
编辑:占悦
责任编辑:戎兵
*文汇独家稿件,转载请注明出处。