首页 > 学术百科

人脸识别技术分析及测试

去年，人们的朋友圈被一个名为“how-old”的网页刷屏了，当用户把个人照片上传后，它就能测算出照片人物的性别和年龄。how-old主要是靠三个技术来完成的，它们分别是人脸检测、性别分类和年龄检测。其中人脸检测是其他两个技术的基础，而年龄检测和性别检测，它们只是在机器学习的过程中解决了分类的问题。相关技术过程涉及到人脸特征的描述、收集可学习的数据，建立一个分类模型以及模型优化。这种应用会分析人们脸上的数十个关键点来得出结论，比如瞳孔，眼角或鼻子——它们会随着年龄而发生明显的变化。

传统的人脸识别技术主要是基于可见光图像的人脸识别，这也是人们熟悉的识别方式，已有30多年的研发历史。但这种方式有着难以克服的缺陷，尤其在环境光照发生变化时，识别效果会急剧下降，无法满足实际系统的需要。解决光照问题的方案有三维图像人脸识别、热成像人脸识别和基于红外的多光源人脸识别技术。由于热成像和红外方案成本短期内难以降下来，现在国内人脸识别前沿厂商多采用三维图像的方法。

人脸识别核心基础—算法

特别的爱电影人脸识别最核心的基础是算法，主流算法大致有基于特征点、基于模板、基于光照估计模型、基于深度神经网络等几种。现在新兴的专业人脸识别厂商多采用深度神经网络来训练计

算机视觉。深度神经网络的主要缺点在于它是一种黑盒方法，其细节隐藏在连接节点（神经元）和节点之间的权值中，而这些权值却是没有明确现实意义的（无法确定哪些权值与哪些属性有关，也就是说这种神经网络是同构的），这就导致了先验信息很难加入到网络的训练过程中。但在实际应用中，如果知道权值与属性之间的对应关系，将会给深度神经网络的应用带来非常大的便利。例如，已有一个用于人脸身份识别的深度神经网络模型和少量具有种族标记的人脸图像数据（假设此种族的数据在之前训练数据中没有出现过），现在想更新网络参数并将此网络用于人脸种族识别。由于深度神经网络通常具有非常多（百万级）的参数，当训练数据量较少时，直接对模型进行更新（所有权值都将被更新）通常会导致过拟合，使网络性能变坏。但如果已知权值与“种族”这一属性的对应关系，那么就可以只对少量的权值进行更新，使模型更加适合于人脸种族识别。基于以上原因，云从科技研发团队创新性提出了异构深度神经网络模型（图1）。

图 1：异构深度神经网络结构

异构深度神经网络不再是一个黑盒，其中的某些权值是与具体的属性相对应的，甚至网络

干栏式建筑中的每层也可被设定为具有明确的含义，例如其神经元的激活值对应于某种粒度的特征。利用大量具有属性标记的训练数据，采用多任务学习机制并在损失函数中加入稀疏性约束，通过考察神经元对不同刺激的反馈，可建立网络单元与属性的映射关系，实现网络结构的语义化。利用异构深度神经网络，可在人脸模型中方便地加入光照、遮挡、角度、年龄、种族等多种先验信息，增强了模型的适应性和特征的表达能力。

对于跨场景人脸识别问题，例如人证比对，即验证身份证芯片照与现场照的身份是否一致，由于两张照片失配程度较大（非同源、身份证照片分辨率低，两张照片年龄跨度大），会导致特征空间中样本分布的差异性较大，导致比对失败。为了将两张照片映射到同一特征空间中进行比较，在异构深度神经网络基础上，云从科技提出了双层异构深度神经网络模型。此模型中每层都是一个深度网络（分别以两张照片为输入），在训练时采用二分类损失函数并对两个网络中对应权值的差异性进行正则化，可实现不同图像空间到相同特征空间的映射。在特征空间中，相同身份人脸图像的类内差异变小，而不同身份人脸图像的类间差异变大，从而增强了特征的判别性。第三届世界佛教论坛

包袱抖不完

图 2：双层异构深度神经网络结构

去年6月，香港中文大学教授汤晓鸥、王晓刚及其研究团队宣布，他们研发的DeepID人脸识别技术的准确率超过99.15%，比肉眼识别更加精准。而事实上，中国科学院下属的云从科技也在去年达到了99.18%，相比其它企业倾向于购买国外现成技术，云从科技一直坚持研发自主的人脸识别核心算法。

LFW性能测试（CIGIT即中国科学院重庆分院）

CIGIT: 99.18%

DeepID2: 99.15%

GaussianFace: 98.52%

DeepID: 97.45%

DeepFace: 97.35%

TL Joint Bayesian: 96.33%

High-dim LBP: 95.17%

小演奏家人脸识别的“准确率”

人脸识别的“准确率”，指的是对全世界最权威的人脸数据库LFW（Labeled Faces in the Wild）进行比对测试的成绩。LFW可以被认作一个考察深度学习系统人脸识别能力的“题库”，由美国马萨诸塞大学阿默斯特分校管理。它会从互联网上（主要是Yahoo News）提取6000张不同朝向、表情和光照环境的人脸照片（大多为知名人士的新闻照片，足够高清，且重复的人的照片基本在同一时期拍摄，也即外貌变化不大）作为考题，可以让任何

系统在里面“跑分”。龙摄天下摄影团

跑分的过程是这样的：LFW给出一对照片，询问测试中的系统两张照片是不是同一个人，系统给出yes或no的答案。98%的准确率，意味着在测试中的所有题目里，人脸识别系统答对了98%的题目。

LFW只是一个纯粹实验室级别、学术性质的测试工具。在样本量可能达到十万级、百万级的实际商业场景下，在数据库取得高准确率的系统并不一定能延续刷出来成绩，其误识率将直线上升，甚至有可能根本没法用。真实复杂场景测试中，十万分之一误识率下，人脸识别98%的准确率会直线下降到70%左右。

云从科技通过自创的同步采集阵列采集大规模结构化数据来解决这个问题。目前，人脸识别算法训练大多采用非结构化数据，这种数据只会标注单一信息，对真实复杂场景下的人脸识别较为困难。云从科技研发出全球首创移动式、全天候、多角度、多场景、毫秒级同步采集阵列，针对人脸识别四大难点（角度、光照、表情、遮挡）进行亚洲人脸结构化数据采集，目前数据量已达到3000万张以上，人数在70万人左右。

结构化数据指具有多种正确标签的人脸数据库。具体指一张人脸照片，可以通过数据库或者文本查询到它的各种信息，包括：人脸ID、俯仰角、偏航角、旋转角、光照信息、表情信息、年龄信息、性别信息、遮挡情况等多种标签。结构化数据训练方法可以用远少于非结构化数据的数据量达到同样的识别效果，当采用大规模结构化数据进行算法训练时，可以使算法的识别准确度、速度、抗干扰性大幅优于非结构化数据的训练效果。

本文发布于:2024-09-22 08:28:06，感谢您对本站的认可！

本文链接：https://www.17tex.com/xueshu/643661.html

上一篇：推荐!12个经典开源人脸识别数据库

下一篇：“刷脸”时代扑面而来

标签：人脸识别人脸深度数据神经网络照片识别模型

留言与评论（共有 0 条评论）