面部识别必看!5篇论文了解如何实现人脸反欺诈、跨姿势识别等(附链接)

作者: 佚名 2019-11-04 10:56:06

 

[ 导读 ]面部识别是计算机视觉中最大的研究领域之一。许多公司都投资于面部识别技术的研究和开发。

面部识别是计算机视觉中最大的研究领域之一。现在,我们可以使用面部识别来解锁手机,在安全门上验证身份,并在某些国家/地区进行刷脸支付。许多公司都投资于面部识别技术的研究和开发,本文将重点介绍其中的一些研究,并介绍五篇有关人脸识别的机器学习论文。

1. 大规模多模式人脸反欺诈的数据集和基准

随着大量实际应用,人脸识别技术变得越来越重要。从智能手机解锁到人脸验证付款方式,人脸识别可以在许多方面提高安全性和监视能力。

但是,该技术也带来一些风险。可以使用多种面部欺诈方法来欺诈这些系统。因此,面部防欺诈对于防止安全漏洞至关重要。

为了支持面部反欺诈研究,本文的作者介绍了一种名为CASIASURF的多模式面部反欺诈数据集。截止本文撰写之日,它是最大的面部反欺诈开放数据集。

具体来说,该数据集包括以RGB,深度和IR方式从1000个主题中拍摄的21000个视频。除了数据集外,作者还提出了一种新颖的多模式融合模型,作为面部反欺诈的基准。

发布/最近更新– 2019年4月1日

作者和投稿人–Shifeng Zhang (NLPR, CASIA, UCAS, China) , Xiaobo Wang (JD AI Research), Ajian Liu (MUST, Macau, China), Chenxu Zhao (JD AI Research), Jun Wan (NLPR, CASIA, UCAS, China), Sergio Escalera (University of Barcelona), Hailin Shi (JD AI Research), Zezheng Wang (JD Finance), Stan Z. Li (NLPR, CASIA, UCAS, China).。

https://arxiv.org/pdf/1812.00408v3.pdf

2. FaceNet:人脸识别和聚类的统一嵌入

在本文中,作者提出了一种称为FaceNet的面部识别系统。

该系统使用深度卷积神经网络优化嵌入,而不是使用中间瓶颈层。作者指出,该方法最重要的方面是系统的端到端学习。

该团队在CPU集群上训练了卷积神经网络1000到2000小时。然后,他们在四个数据集上评估了他们的方法。

值得注意的是,FaceNet在著名的野外标记人脸(LFW)数据集上的准确性达到99.63%,在Youtube Faces数据库上达到95.12%。

发布/最近更新– 2015年6月17日

作者和撰稿人– Florian Schroff, Dmitry Kalenichenko, and James Philbin, from Google Inc.

https://arxiv.org/pdf/1503.03832v3.pdf

3. 概率脸部嵌入

用于面部识别的当前嵌入方法,能够在受控设置中实现高性能。这些方法通过拍摄一张脸部图像并将有关该脸部的数据存储在潜在的语义空间中而起作用。

但是,当在完全不受控制的设置下进行测试时,当前方法无法正常执行。这是由于在图像中缺少面部特征或模棱两可的情况。这种情况的一个例子是监视视频中的人脸识别,其中视频的质量可能很低。

为了帮助解决这个问题,本文的作者提出了概率面孔嵌入(PFE)。作者提出了一种将现有确定性嵌入转换为PFE的方法。最重要的是,作者指出,这种方法有效地提高了人脸识别模型的性能。

发布/最新更新– 2019年8月7日

作者和贡献者–Yichun Shi and Anil K. Jain, from Michigan State University.

https://arxiv.org/pdf/1904.09658.pdf

4. 人脸识别的魔鬼在噪音中

商汤研究院,加利福尼亚大学圣地亚哥分校和南洋理工大学的研究人员研究了大规模面部图像数据集中的噪声影响。

由于它们的规模和成本效益,许多大型数据集都容易产生标签噪声。本文旨在提供有关标签噪声源及其在人脸识别模型中的后果的知识。此外,他们的目标是建立并发布一个名为IMDb-Face的干净人脸识别数据集。

该研究的两个主要目标是发现噪声对最终性能的影响,并确定注释脸部身份的策略。为此,该团队手动清理了两个流行的张开面部图像数据集,MegaFace和MS-Celeb-1M。他们的实验表明,仅在其清理的MegaFace数据集的32%和MS-Celeb-1M清理的数据集的20%上训练的模型与在整个原始未清理的数据集上训练的模型具有相似的性能。

发布/最新更新– 2018年7月31日

作者和贡献者–Fei Wang (SenseTime), Liren Chen (University of California San Diego), Cheng Li (SenseTime), Shiyao Huang (SenseTime), Yanjie Chen (SenseTime), Chen Qian (SenseTime), and Chen Change Loy (Nanyang Technological University).

https://arxiv.org/pdf/1807.11649v1.pdf

5. VGGFace2:用于识别跨姿势和年龄的人脸的数据集

关于深度卷积神经网络的面部识别已经进行了许多研究。 反过来,已经创建了许多大规模的面部图像数据集来训练那些模型。 但是,本文的作者指出,先前发布的数据集并未包含有关面部姿势和年龄变化的大量数据。

在本文中,牛津大学的研究人员介绍了VGGFace2数据集。 该数据集包含年龄,种族,照明和姿势变化范围广泛的图像。 数据集总共包含331万张图像和9,131个对象。

面部识别 神经网络 人工智能
上一篇:人工智能在企业中开始变得务实 下一篇:2019北京智源大会在京开幕,中外学术大咖共话人工智能研究前沿
评论
取消
暂无评论,快去成为第一个评论的人吧

更多资讯推荐

被寄予厚望的AI,到底是人工智能还是人工智障?

近几年,人工智能风头正盛,人们的衣食住行都离不开它,在我们的生活应用场景中也是十分常见如:刷脸支付、自动驾驶、AI辅导、语音助手等等,但近来人工智能频频出错,这不禁令人发问,他们真的是人工智能吗?又或是叫人工智障更加准确。

MiHomes科技资讯 ·  9h前
人工智能影响制造业的四种方式

这些年来,人工智能取得了很大的进步。它可以影响许多不同的行业,这主要是因为它改进了处理、算法和它所保存的数据量。

Cassie ·  17h前
机器人来帮“盲” 视觉障碍者重新看世界

当今社会是科技引领潮流的社会,随着科技的快速发展,机器人产业正迅速崛起。基于此,关爱视觉障碍者将收获利好,导盲机器人的发展势在必行。

林中易木 ·  19h前
教AI开发软件:IBM开源数据集Project CodeNet,含有1400万个代码示例

IBM已组建了一个庞大的源代码库,用于教机器学习程序学习编程。

小云 ·  19h前
15年内培育恐龙,马斯克难道想把恐龙也送上月球?

15年内可以育种和基因改良产生“超级外来物种”——恐龙,科幻电影中的侏罗纪公园指日可待。

子豪 ·  23h前
当BI遇到AI,看"最强大脑"如何帮我们做出决策?

人工智能和机器学习增强了商业智能系统和战略,为整个企业提供了决策背景和建议。

计算机世界 ·  1天前
超胆侠来了!「蝙蝠感知」AI让智能手机听声生成3D图像

格拉斯哥大学的计算机科学家和物理学家在《物理评论快报》杂志上发表的一篇论文中概述了这项研究,它可以应用于安全和医疗保健领域。

佚名 ·  1天前
Gartner 最新魔力象限报告显示 IBM 为全球企业级 AI 技术领导者

IBM 在 Gartner 2021年“云 AI 开发者服务魔力象限“和“数据科学与机器学习平台魔力象限”报告中均被评为领导者。

佚名 ·  1天前
Copyright©2005-2021 51CTO.COM 版权所有 未经许可 请勿转载