生物识别的新突破：张军平、冯建峰团队合作研发用于步态识别的步态集合方法 - 研究资讯

近期，复旦大学计算机科学技术学院张军平教授与类脑智能科学与技术研究院教授冯建峰成立联合研究团队提出了步态集合理论和算法，为步态识别全面走向实用化提供新思路，在生物识别领域实现新突破。

近年来，随着高清摄像头的普及和人工智能的成熟，生物认证尤其是人脸识别已经成为机场、高铁、手机支付等应用场所识别人身份的重要手段。然而，在众多生物认证技术中，人脸尽管识别率高，但易被攻击、受光照姿态影响大，可识别距离不超过7至8米；而门禁系统常用的指纹必需要有接触式设备支持，虹膜的可识别距离不超过1米5，且易受美瞳等隐形眼镜产品的影响。这些问题，困扰了多数常用的生物认证技术，导致性能下降明显。因此，有必要在远距离、光照变化较大等情况下，发展能更抗攻击的生物认证系统。

步态即人走路的姿态，是由迈步、跨步、收步的周期性动作组成的。心理学研究表明，每个人的走路姿态是不同的，因而可用其来进行身份识别。另外，步态在20米开外也能对人进行有效识别，是唯一可远距离识别的生物认证特征。其识别机制类似于人类的快思维认知，即只需要看清轮廓即可快速识别熟悉的人，而不用进行过于缜密的思维。例如，视频步态识别帮助抓捕了著名的苏湘渝系列持枪抢劫杀人案的罪犯周克华。此外，步态是人在无戒备情况下的自然走路姿势，不容易隐藏。但步态识别容易受路面情况如水泥地、草坪等和是否背包、不同穿着等外在因素的影响，相关研究和实际应用有待进一步推进。

要识别步态，常用的生物认证策略有两种。一是基于步态走路周期性形成的视频序列，通过逐帧比较来识别步态。该方法性能高，但识别效率低。另一种是将步态的视频序列进行平均，形成一幅步态能量图模板，并基于此模板来识别。该方法有实时的效率，但识别性能不如逐帧比较的方法。在实际环境中，摄像头采集到的步态往往来自多个角度。如果算法只能处于单个角度，则很难将其推广至实际应用中。

步态轮廓图序列(CASIA-B)[1] 态模板示意图 [2]

自2006年张军平教授获得科技部探索类项目支持起，其团队至今已经对步态识别进行了近13年的研究积累，先后在模式识别顶级期刊IEEE TPAMI，IEEE TSMCB，ECCV上发表高质量论文，在低分辨率步态识别、时间保持不变模板等方面获得一系列研究成果。其中时间保持不变模板曾在2012年为第三方在步态公用数据集OU-ISIR进行了测试，被该文列为当时的六个state-of-the-art算法之一，并获得排名第三的成绩。

基于以上成果，为了获得最佳性能和潜在的实用性，张军平教授与类脑研究院院长冯建峰教授组成联合研究团队，进一步跳出以往步态识别的思路，将传统步态识别中一直依赖的步态周期摒弃，而将步态序列看成是一个集合，颠覆性地提出了步态集合理论和算法。该方法对步态的次序不敏感，可以在少量步态图像输入前提下获得最大的识别性能。

步态集合模型示意图

据研究人员介绍，该方法既不将步态序列简单压缩成一张图，也不将其看成一个普通的视频序列，而将步态序列看做一帧帧步态轮廓图组成的集合。这一改进给模型带来了巨大优势，使其大幅超越了现有所有算法。在步态识别公用数据集CASIA-B上，此前多数方法在使用62个人做训练时准确率都不超过70%，此方法仅使用24个人准确率就接近80%，使用62个人则超过了90%，使用74个人训练更是达到了通常要进入实用级的指标性能、准确率95%，比现有步态识别领域已知的、同样采用单个模型的最好性能92%还高出3个百分点。在其他两个公用数据集上，步态集合方法均取得了最优性能。此外，集合的视角还给模型带来了一些新的特性。一方面，由于将序列的限制放宽到了集合，就可以将不同地方采集到的帧都放在一起作为输入，模型可以很好的融合不同帧中的信息而获得更高的准确率。另一方面，模型可以处理任意大小的集合，少至1帧，上不封顶，且随着帧数增加识别的准确率也逐步攀升。值得一提的是，这些新特性是模型天然拥有的，并不需要有针对性的训练。

该工作发表在人工智能顶级会议AAAI 2019上，并于2019年2月2日进行了口头报告。步态集合方法将成为步态识别领域的标志性成果，为步态识别全面走向实用化打开了新的视角。这一识别也将有助于研究大范围优先的认知理念等人类认知模型的形成。

Contact Us