人脸识别硬核科普:人群中看你一眼,从此不忘你容颜

来源:www.xjctc.net   时间: 2020-01-03

小编是一个天生懒惰的人,同时也是一个敏锐的孩子,这样的人享受着被技术服务的乐趣。

例如,在十多年前人们还在使用现金的时代,小编在商店里买了东西,排队等候结账。每当我看到收银员寻找零时,我都非常焦虑,以至于我无法拿东西直奔。人。那时,年轻的小编握紧拳头,梦想发明一种不需要改变的方法。

后来,这个在我心中萌芽多年的梦想被其他人所认识,我很高兴享受它。使用手机扫描代码可以比现金支付更快更快。但上帝知道小编是“懒惰癌症+紧急癌症”的晚期。随着时间的推移,我觉得抬手扫描代码并输入密码非常麻烦。因此,后来出现的指纹支付被保存为一个小系列。

后来,即使手指也不需要动,因为有一个“刷脸付款”,凭借iPhone的出色体验,我不得不说小编喜欢这个功能。

嗯,刷脸可以避免小编长期等待付出的焦虑和不安,所以经过多年沉浸在IT室编辑部的技术环境中,小编觉得有必要为大家说话。刷脸就是这样,它可以被视为一份亲切的报告!

顾名思义,“刷脸”是一项关键技术的背后:人脸识别。

由于使用智能手机,请不要关注这两年。事实上,最早的人脸识别技术研究可以追溯到20世纪50年代。当时,科学家正在研究面部轮廓的提取方法,但受到技术层面的限制,该技术的相关研究停滞不前。直到20世纪80年代,人脸识别方法取得了新的突破。介绍了神经生理学,脑神经学和视觉的相关知识,并进行了人脸识别。发展阶段。

因此,目前阶段的人脸识别不是单一技术,而是神经生理学,脑神经学,计算机视觉和技术学科等方面的结合。然而,它本质上是一种计算机视觉技术。

当然,IT House对本文的工作重点不是回顾人脸识别的历史,而是要谈谈人脸识别背后的一些基本原则。

人脸识别技术系统的基本逻辑架构

我们使用人脸识别技术每天解锁手机和结账付款是很自然的,但我相信很少有学生会深入思考这项技术背后的过程。

早些时候我们说计算机视觉是最接近人脸识别的技术。所以让我们从这开始吧。

通常,计算机视觉使用相机和其他设备代替人眼来获取图像,使用计算机来处理图像信息,并且集成人类认知模型以建立人类视觉计算理论。

其中,最困难的无疑是如何处理图像信息以及如何模拟人类的认知模式。

为了解决这些问题,计算机视觉还引入了诸如图像处理,模式识别,图像理解和图像生成之类的主题的知识。

图像处理是将原始图像转换为计算机更容易识别的图像;模式识别是计算机判断它想要识别什么以及如何识别它的过程;图像理解是对图像中描述的场景的分析;图像生成,例如,换句话说,当图像中的部分信息丢失时,可以添加缺失的信息.

这些是计算机视觉需要依赖的主题技术。在这里,我们将重点关注模式识别,这是一个独立的理论系统,特别适用于计算机视觉领域,它代表了计算机代表的图像与一致类别的匹配过程。

有点难以理解。 IT House为每个人解释它。所谓的“认可”意味着理解然后区分。你知道什么?已知的是从图像总结的目标对象的图像和特征。怎么说?它是将汇总的功能与他们在识别之前掌握的功能数据库进行比较。

我们人类认识到同一个对象并遵循这个逻辑。首先总结一下这些功能,然后进行比较。至于之前的“模式”,它有点抽象,你可以理解为一个法则,它会影响特征和类型比较的结果。

是的,面部识别基本上就是这个过程。

因此,我们遵循模式识别的思想来审视其整个过程:预处理,特征提取和分类。我们绘制以下流程图:

预处理是第一步,但这部分工作可能非常复杂,例如降低图像中的噪声干扰,提高清晰度,以及包括图像滤波,变换,转码,模数转换等。

特征提取意味着提取对预处理图像中的识别具有显着影响的特征,并且在该过程中减小图案特征的尺寸,使其更容易处理。这是一个复杂的过程,稍后在我们讨论具体方法时会反映出来;

分类是根据特定标准对提取的特征值进行分类,以便于决策制定。

例如,计算机需要识别此照片中的人物。当它得到照片时,可能会觉得图片太暗,首先提高亮度,然后发现太多噪音,然后降低噪音.操作感觉之后,然后将照片转换成数字信息,这个过程是预处理的。

提取的特征值将进入单独的特征空间,因为它允许更好的识别和分类。接下来,我们需要对特征空间中的数据进行分类,让他们注视眼睛,鼻子到鼻子,头发到头发.根据这些分类数据,计算机可以做出识别和决定。

当然,为了便于理解这个逻辑过程,IT House在这里只是一个粗略的描述,可能是不准确的,实际步骤相当复杂,应考虑各种干扰因素,如图像质量是不清楚,背景复杂,图像不均匀照明,扭曲目标姿势,或戴头饰,眼镜,长胡须,化妆等。

同样重要的是要注意,这种模式识别系统需要一个自我训练和学习的过程,其中最重要的是训练以前的分类错误率(分类器训练),因为在之前的分类中,我们没有保证分类结果100%正确,但必须以一定的错误率控制。必须通过大量训练样本不断纠正,以使错误率符合要求。

那么,基于上述计算机视觉模式识别的讨论,我们可以给出人脸识别系统的主要功能模块:

可能有一个小伙伴认为上面提到的功能模块太简单了,所以我们会更精确并给出以下逻辑架构图。我相信不难理解:

人脸识别的主流方法

在上面部分,我们主要介绍人脸识别的基本逻辑流程。事实上,人脸识别的基本思想是相似的。它是提取图像中的特征,将其转换为合适的子空间,然后该子空间测量相似性或分类学习。但问题是,你如何使用协调有效的客观世界表示?我们需要找到一个合适的子空间,如何分类,以便区分不同的类,收集类似的类别?为了解决这些问题,已经开发了各种方法和解决方案。

因此,我们所谈论的人脸识别技术是一般性的。实际上,这是许多技术和方法的集合。

我们可能希望根据上面的逻辑结构图逐步解释。

1.预处理

面部图像的预处理在该步骤中没有太多要说的,主要包括噪声消除,灰度标准化,几何校正等。这些操作通常通过现成算法实现,这是相对基本的操作。但是,应该注意的是,这里的要点是静态人脸图像的预处理。如果是动态人脸图像的预处理,则更复杂。通常,动态面部图像首先被分成一组静态面部图像。然后,完成面部的边缘检测和定位,并进行一系列处理,这里不进行扩展。

2.特征提取

图像特征的提取是相对重要的步骤(上述图案空间跨越特征空间),但它也是图像处理的相对早期的步骤。目前,图像特征提取的方法很多,但实际上,我们认为图像的特征仍然可以分类,如颜色特征,纹理特征,空间关系特征,形状特征等。匹配方法,部分哪些更经典易用,如HOG特征方法,LBP特征方法,Haar特征方法等,当然不可能逐一解释,因此我们选择其中一种 HOG特征方法。

HOG特征,也称为方向梯度直方图,由Navneet Dalal和Bill Triggs在博士中提出。 2005年的论文。让我们看看它是如何运作的。

  • 友情链接:
  • 版权所有© 新疆计算机培训中心 | 新ICP备10201303号-1 | www.xjctc.net . All Rights Reserved | 网站地图