旷视人脸识别商业系列大讲堂—关于人脸识别你需要知道的

作者: 佚名 2016-10-31 21:24:12

 到底什么是人工智能,机器学习和机器视觉?

人脸识别和人工智能又有什么关系? 越来越多的人工智能正在逐步隐藏其外形,人类对它的观察和理解也变得越加具有挑战性。即使是专家们自己也并不总能完全理解人工智能系统是如何运行的。那么,今日起,旷视(Face++) 将在微信公众号( megvii-tech )开设“人脸识别商业系列大讲堂”,意在让人们对人工智能在商业领域的应用层面具有基础和客观的理解,当然希望更具象的形容“Power Human with AI.” 尽微薄之力让更多人了解人工智能的核心。

本篇是人脸识别大讲堂系列第一篇,也是一篇关于人工智能和人脸识别应用最基本的科普。

读——人工智能 | 机器学习 | 深度学习

人工智能( Artificial Intelligence ),英文缩写为AI。广义上的人工智能实际上等同于机器智能,通俗的解释就是就是赋予机器以人的智慧,让机器像人一样学会思考。而机器学习 ( Machine Learning, ML ) 是人工智能的一个研究分支,主要是设计和分析一些让计算及自动获取知识的算法,涉及到概率论、统计学、逼近论等多个领域。深度学习( Deep Learning, DL )又是机器学习的一个分支,可以理解为用计算机的算法模拟人类大脑的深度神经网络,然而对于神经网络我们还没有一个严格的定义,但其特点是试图模仿大脑的神经元之间传递,处理信息的模式。

因此,简单而言,人工智能、机器学习和深度学习是一种包含关系。我们通过在计算能力和计算方式上的探索在不断接近人工智能的本质——一个具备自我学习和应变能力的智能机体。但我们不能单纯地认为人工智能只是把数学模型做的更准确一点,让机器拥有拟人化能力是一个漫长的发展过程:毕竟从计算机诞生到现在的移动互联网,我们就用了70年的时间。而现在我们才刚开始触摸到到智能时代的拐点的边缘。我们之所以认为是“今天”处在智能时代的临界点是因为以下最重要的两个条件的形成:

1. 计算能力到达了一定高度,摩尔定律推动了世界的发展;

2. 大数据的积累、传感技术的成熟。

今年正是人工智能概念提出的第六十周年,当年参与达特茅斯会议的最后一名在世的科学家——人工智能之父马文明斯基也于年初离世,我们经历了一个时代的结束也面临着一个新的时代的开始。大数据和机器学习让计算机变得特别聪明,以至于使计算机能够在某些领域很大程度的超过人类的极限能力,比如谷歌AlphaGo战胜了围棋世界冠军李世石,而人工智能的目的绝对不是让计算机和人类下下棋而已,可以说未来几十年将面临由大数据带来的智能革命,机器会获得越来越全面的能力。

但实际上,人工智能的应用范围博大精深,繁冗复杂,在每一个垂直领域的应用都需要克服难以想象的障碍。所以,我们先拆分大脑的功能,让机器一点点实现智能化。

人的大脑需要借助各种感官,如眼睛、耳朵等,感知外界信息,然后进行判断,这其中用机器来代替人眼来做测量跟判断的动作,称为机器视觉,机器视觉是人工智能学科中发展的最为快速的分支,而当今大家熟知的人脸识别技术就是机器视觉最富有挑战性的课题之一。

人脸识别——人脸检测 | 人脸分析 | 人脸识别

在深度学习诞生前,人脸识别研究人员试图不断改进、提高计算机识别人脸的能力,但相对人类本身所具有的人脸识别能力仍然望尘莫及。直到2012年,深度学习开始影响人脸识别技术的发展,基于深度卷积神经网络的方法在不断突破人工智能算法的世界纪录。如何在一张环境复杂的图片中快速识别出人脸,对于人来说很简单,但对于机器而言,需要经历以下几个步骤: 人脸检测、人脸分析、人脸识别。

一张图片输入机器后,需要先找到人脸的位置——人脸检测,然后在这个基础上定位人脸关键点的位置( 如眼睛中心或嘴角等 )并提取特征值——人脸分析,每个系统关键提取的数量相差很大,有的只有左右眼睛中心两个点,有的可能多达近百个点。这些点的位置一是用来做人脸的几何校正,即把人脸通过缩放、旋转、拉伸等图像变化变到一个比较标准的大小位置。这样待识别的人脸区域会更加规整,便于后续进行匹配。同时,现在的实际系统一般也都配有人脸光学校正模块,通过一些滤波的方法,去除一些对光照更加敏感的面部特征。在做完这些预处理之后,就是从人脸区域提取各种特征,包括 LBP、HOG、Gabor 等。最终相关的特征会连接成一个长的特征向量( Feature Vector ),然后匹配出人脸的相似度,根据相似度的大小,系统会判定两张图片到底是不是一个人——人脸识别。所以,想要降低人脸识别的失误率,需要强大的算法支撑。

但失误率低是否就能在商业领域中站稳脚跟?

产学研用——人脸识别的商业应用价值

常言道:实践出真知。

再强大的算法如果不和现实的应用场景相结合也无异于纸上谈兵,除了名次的提升和无限接近于100%的实验结果,并没有带来实际的价值,更何谈社会效益。人工智能产生的初衷是为了取代人力,将人类解放出来去创造更多的价值,人脸识别技术也同样应该遵循这个基本原则。目前,随着技术的发展和市场需求的快速增长,人脸已经在很多领域发挥了这样的价值,如远程在线核身,用刷脸替代实名场景中需要的人力和物力。

而在实际应用场景中,我们通常会提到两个概念:即 1:1 和 1:N 。

1:1 可以粗暴地理解为证明你就是你。事实上,1:1 属于一种静态比对,在泛金融的核身、信息安全领域中还有潜在巨大的商用价值。例如在机场安检口,总是需要有一个人拿着你的身份证看看你再看看证件,来确认你就是持证人,这种场景就是典型的 1:1 场景。然而人的肉眼识别精准度是在95%左右,且长时间工作容易疲劳,所以机场安检人员需要在半个小时到一个小时之内换班一次来保证识别的准确率。而人脸识别技术的出现,就完全能够解决这种场景下“需要一个人”的问题,当然,这种价值同样能在考试考生身份的审核、酒店入住办理,火车站人票合一认证等任何需要实名制的场景中体现。

人证合一比对终端是典型1:1应用场景

1:N 的概念则是在 N 个人中找出你。这里的 N 是一个数据库,里面有无数张人脸信息,那么计算机要做的就是在无数的人脸中找到你是谁。1: N 具有动态比对和非配合的特点,所谓的动态也就是识别的不是照片,不是图片,而是一个动态的视频流;非配合是指识别对象不用感知到摄像头的位置只要走进识别范围就能完成识别工作。这两个特点使 1:N 的难度要远高于静态 1: 1,因为机器面临着曝光过度、逆光、侧脸、远距离等挑战。

旷视(Face++)的智能门禁是典型的1:N 应用场景

在行业应用中,1:1 更多是应用在金融、核身、信息安全领域,特点是精准安全。而1:N主要应用的方向是在商业、安防等。比如一个女士去商场买包包,店员不知道她是否是会员。如果引用机器视觉技术,不管店员换没换,当顾客进门的时候她的信息就被推送给店员完成精准的推荐,这就是机器视觉在商业领域VIP客户识别的典型应用。在安防方面的应用比如公共场所动态监控、缉拿逃犯、人员布控等。

需要说明的是,人脸识别技术的成熟虽然能让计算机替代人眼取代一大部分在审核、找人工作中的劳动力,但它并不能作为严肃场景中的唯一的验证方式。举例说明,在某公共场所动态监控缉拿逃犯时,因受外界环境干预,可能会同时弹出5个疑似的人选,这时就需要人工协助,共同完成识别确认过程;又或者在企业应用中,具有较高机密性质的场所可以采用人脸识别和刷卡的双重认证来确保安全性。

可以肯定的是,相比于人眼的效率来说,人工智能的人脸识别能力要远远超过人类。但这并不代表机器不会出错,因此在准确形容人脸识别通过率的专用词汇中,有误识率一词,就旷视(Face++)而言,完全可以做到在万分之一误识率下使通过率达到98%,能够满足日常生活中的应用场景。毕竟,人工智能的意义是赋予人类更强大的能力、协助人类更高效的工作——正如如我们开篇说的,Power human with AI,而并非取代人类。

人工智能
上一篇:Facebook城会玩!让无人机给偏远山区提供移动网络 下一篇:人脸识别教父李子青:技术创新赋能行业未来
评论
取消
暂无评论,快去成为第一个评论的人吧

更多资讯推荐

AI行业寒潮下,智能物流机器人产业迎来“风口”

“人工智能,前景很好,但‘钱’景不好 ” 、“2018年,人工智能的进展就是没有进展”、“2019年的AI行业已如石墨烯一样,尽显疲态”……一篇《投资人逃离人工智能》文章又给人工智能行业泼了一身冷水。人工智能融资难、“寒冬论”再一次戳痛每个人工智能从业者的心,激起大众的焦虑情绪。

AI报道 ·  16h前
人工智能应用在智慧社区五大场景

物联网、云计算、大数据、人工智能正逐步从概念走向应用。越来越多的传统产业也开始探索和创新,积极拥抱互联网和新技术。未来,人工智能技术可能会颠覆社区管理。

有熊 ·  16h前
基于PyTorch的CV模型框架,北大学生出品TorchCV

在机器学习带来的所有颠覆性技术中,计算机视觉领域吸引了业内人士和学术界最大的关注。

张倩、泽南 ·  17h前
高位截瘫患者重新行走:靠意念指挥外骨骼,法国脑机接口新突破

依靠介入头部的 2 个传感器,法国里昂的一名瘫痪男子 Thibault 实现了操控外骨骼装备来助力行走。

孙滔 ·  21h前
2008 年预测 2020 年生活方式:基本都实现了

美国皮尤研究中心曾在 2008 年预测 2020 年的生活方式,目前来看,该研究的预测基本已经实现。而对于未来 10 年,也就是 2030 年左右人们的生活,在 2017 年底的世界经济论坛上,800 多名信息和通讯技术领域的技术高管和专家给出了如下预测。

佚名 ·  21h前
机器学习的正则化是什么意思?

正则化的好处是当特征很多时,每一个特征都会对预测y贡献一份合适的力量;所以说,使用正则化的目的就是为了防止过拟合。

佚名 ·  21h前
为什么我的CV模型不好用?没想到原因竟如此简单……

机器学习专家 Adam Geitgey 近日发布了一篇文章探讨了这一简单却又让很多人头痛的问题,并分享了他为解决这一问题编写的自动图像旋转程序。

机器之心 ·  22h前
中文自动转SQL,准确率高达92%,这位Kaggle大师刷新世界纪录

首届中文NL2SQL挑战赛上,又一项超越国外水平的NLP研究成果诞生了。在NL2SQL这项任务上,比赛中的最佳成绩达到了92.19%的准确率,超过英文NL2SQL数据集WikiSQL目前完全匹配精度86.0%,执行匹配精度91.8%的最高成绩。

郭一璞 ·  22h前
Copyright©2005-2019 51CTO.COM 版权所有 未经许可 请勿转载