0
关注
97895
浏览

为什么香港中文大学研发的人脸识别算法能够击败人类?

查看全部 18 个回答

邹哥亮 核心会员 用户来自于: 北京市
2026-01-16 23:08
谢邀! 文章刚出来时,叫一实习生业余去研究番,但到目前他还没来得及做报告,这里仅以我有限的了解回答下。(多图) 暂不究算法细节,就此新闻,需要发问的是“文章中的识别准确度98.52%是怎么得来”以及“人类的人脸识别能力(Human-Level Face Verification Performance)是如何度量的”,要查清这些问题,还得从LFW说起。 1、LFW数据集及人脸识别实验设计 1.1 LFW人脸数据集 LFW(Labeled faces in the wild[1])是人脸识别研究领域比较有名的人脸图像集合,其图像采集自Yahoo! News,共13233幅图像,其中5749个人,其中1680人有两幅及以上的图像,4069人只有一幅图像;大多数图像都是由Viola-Jones人脸检测器得到之后,被裁剪为固定大小,有少量的人为地从false positive中得到[2]。所有图像均产生于现实场景(有别于实验室场景),具备自然的光线,表情,姿势和遮挡,且涉及人物多为公物人物,这将带来化妆,聚光灯等更加复杂的干扰因素。因此,在该数据集上验证的人脸识别算法,理论上更贴近现实应用,这也给研究人员带来巨大的挑战。 图1. LFW人脸图像示例 1.2 LFW数据集上的识别实验设计 官方文档[2]详细给出了待测算法在LFW上实验的规范,以便于不同算法间的比较。 识别算法要完成的工作是人脸验证(Face verification),即判断给定的两张图片(一对)中的人脸是否来自同一个人。 LFW将数据集分作两大块,[View 1]用做供研究人员选择其算法模型所用,包括一个训练集和一个测试集,不管是训练集还是测试集,其图片都是由M对来自同一人脸的图像和N对来自不同人脸的图像构成;当确定了模型后,算法将在[View 2]上实验,[View 2]包含10个子集,每个子集构成规则同刚讲到的训练集或测试集,实验过程大抵为: A、每次从10个子集中选一个做为测试集,其余9个做为训练集; B、通过训练集确定模型的参数; C、对测试集进行预测; D、计算预测的准确度; 进行十次之后,平均的准确度即为该算法在LFW上的识别准确度,GaussianFace的98.52%即是如此计算的。 图2. 训练集示例 1.3 其他的人脸数据库 这里顺带把文章[0]中用到的两个公开数据集在这说下: A、Multi-PIE[3] 在可控环境下人为产生的337个人的750,000张图片,包含15个视角及19种光照变化。 图3. Multi-PIE图像示例 B、MORPH[4] 多种族多年龄段图像集,成像条件类似证件照过程。 图4. MORPH图像示例 图5.MORPH图像集统计信息 粗略看来,LFW较之上面二者,更贴近人类活动的现实场景,在LFW上验证的识别算法理论上可能应对现实中特定的或基本的人脸识别应用。 当然,还有其他诸多公共数据集,在[2]中有详细列表,或在http://www.face-rec.org/databases/获知。 2、 人类的人脸识别能力 最让人类纠结的事情莫过于明知自身有着高度的智慧,却不知这种智慧的运作机理,难道这种智慧里面就不包含了解这种智慧运作机理的智慧吗?人类想创造出拥有同等智慧的物体却始终不能得偿所愿。 对人脸的识别能力是人类智慧中的一种,确切地说是人类视觉认知能力之一。如果说不能了解这种能力的运作机理,那是否可以对这种能力进行度量呢?比如说,人类在体育竞技上取得的成绩即可以认为是人类所具备的那些能力的度量,同理,也可以设计类似的分值以粗略量化人类对人脸的识别能力。 文章[0]中提到的人类的人脸识别能力(Human-Level Face Verification Performance)是引自文章[5]的。 作者利用Amazon众包服务[6],对选自LFW的6000对图片,平均每对图片进行10人(不同人)次的识别,大约分配给了240000个用户去进行人脸识别的测试,准则如下图: 此项实验其考察了人类在三种情形下对人脸的识别能力:
  • 对包含人脸的图像整体的识别能力,也就是说,不只是人脸,其他诸如体态、服饰,场景等也可能做为识别成功的因素,自然这种情形的准确度是最高--99.20%;
  • 对人脸部图像的识别能力,也是一般人脸识别算法的处理对象,准确度为97.53%;
  • 对不包含人脸的图像整体的识别能力,也就是说,遮上人脸,只通过诸如体态、服饰,场景等信息进行识别,自然这种情形的准确度要低--94.27%;
好了,被打败的人类识别能力就是这样定义的,做为人类一分子的你,不管是拖了后腿还是低估了你,你就是这样被算法打败的!不服?你上最吊大脑秀去啊。。。当然,所谓的人类识别能力也不是只有这家子的定义,还有好几个呢,当然,它们都不出意外地被这个或那个算法打败了!!!所以,媒体宣传说人类识别能力首次被超越是不严肃的。我们过一下文章[0]提到的那几个被打败的人类识别能力的定义:
  • [7]中的人类代表是作者在AiT(现3M)公司的同事,共21男(16男5女),年龄在20-40;
  • [8]中的人类代表是Texas大学的91名学生;
  • [9]中的人类代表是43名在校大学生;
3、关于GaussianFace终于轮到主角出场了,是不是等了好久了,伦家可是打败了人类,上了头条的X星人。。。你这么吊你家里人知道吗!知道吗!关于算法, @梁亦聪 已经细读了文章,也给了详细的解释; @笨猫猪 也提到多任务学习(multi-task learning),这方法是用做得到模型,提升性能而已;GaussianFace(下面用GF表示)的核心在于高斯过程(Gaussian Processes,GPs)[10]的应用,包括Gaussian Processes for classification和Gaussian Process Latent Variable Model (高斯过程隐变量模型,GPLVM),其优点如下:
  • 高斯过程是一种基于核函数的方法,是一种非参数概率模型,具有完全的贝叶斯公式化表示;根据训练样本,可以从先验分布转换到后验分布,不仅能对未知输入做输出预测,同时也能给出该预测的精度参数。(原文描述为:Moreover, the GaussianFace model is a reformulation based on the Gaussian Processes (GPs), which is a non-parametric Bayesian kernel method)
  • GPLVM的特性在于,当观测数据的样本个数比较少时,仍然可以用来寻找观测数据的低维流形,也就是说GPLVM非常适合处理小样本的高维数据。这就是GF只需要少量样本(约40000),便在LFW上取得 了良好的结果;
  • 相比于SVM的参数需要通过交叉验证方法或者经验法得到,高斯过程隐变量模型中需要确定的模型参数包括核函数中的超参数((hyper parameter)和隐变量Z,采用的方法是共扼梯度优化法( Conjugate Gradient);至于神经网络或深度学习,那更是门调参数的艺术;
与其说GF打败了人类,不如说其打败了深度学习,至少目前在LFW是这样,FaceBook的DeepFace或是Face++的人脸DL表述都得屈居其后。同时不负责任地说句,这可不是GPs首次打败神经网络,就在DeepLearning就要一统江湖的时候,GF是不是让还没摊DL这趟浑水的同学看到了希望呀。那是不是说GF就是人脸识别的终极方案呢?4、人脸识别碎碎念说到人脸识别,很多人都要说这不很成熟的玩意嘛。确实,毕竟大年轻的人工智能历程上有着悠久的历史,随便找个这方向的研究生,甚至是做过这方向毕设的本科生,也能捣鼓出将一宿舍人识别出来的程序,EignFace/FisherFace,PCA/LDA,或是LBP/Gabor/HOG/MBLBP/SIFT...扔到SVM/LR/Adaboost...里去,或是赶赶DL的时髦,哥也是搞过智能的,人脸识别有那么难吗,骗谁呢,当我没上过大学是吧。。。大伙儿接触到的人脸识别场景大致如下:
  • 人脸考勤:当然要求正脸了,光照较稳定;
  • 智能设备的人脸登录:正脸,光照可能有变化,但识别不出来也不负责;
  • 安检(室内):固定的机位得到合适的人脸,采用近红外摄像头可一定程度避免光照影响;
总之,都不是将被识别对象放置于生活场景的应用,而且不容许被动失败,这样,大家当然觉得人脸识别还挺成熟。但当我们考虑到全网人脸搜索,SNS上人脸识别的时候,问题的难度便呈几何级增长; 5、参考 [0].Surpassing Human-Level Face Verification Performance on LFW with GaussianFace.[PDF] [1]. http://vis-www.cs.umass.edu/lfw [2]. Labeled Faces in the Wild: A Database for Studying Face Recognition in Unconstrained Environments.[pdf] [3].MULTIPIE.ORG [4]. MORPH Database [5].Attribute and Simile Classifiers for Face Verification [6]. AWS | Amazon Mechanical Turk [7].Comparing Human and Automatic Face Recognition Performance. [8].Face Recognition Algorithms Surpass Humans Matching Faces over Changes in Illumination. [9].Comparing Face Recognition Algorithms to Humans on Challenging Tasks. [10]. The Gaussian Processes Web Site

关于作者

问题动态

发布时间
2026-01-16 23:51
更新时间
2026-01-16 23:51
关注人数
0 人关注

推荐内容

人脸识别如何自学?
人脸识别技术会毁在整形医院手里吗?
人脸识别最前沿在研究什么?
人脸识别能否识别出超人?
人脸识别中样本不足如何解决?
人脸识别技术,在我国航空领域未来会有怎样的落地应用和实际的作用?
人工智能和人脸识别是什么关系?
人脸识别和虹膜识别哪个更好?
小米8se采用的是人脸识别是虹膜识别的吗?
qq空间 人脸识别 是怎么做到的?
All Rights Reserved Powered BY WeCenter V4.1.0 © 2026 粤ICP备20025096号-2
  

粤公网安备 44190002007303号