61 回答
人脸识别最难的部分是有充分适应各大光线环境的人脸预处理算法,需要在各种复杂的光线环境中提取到人脸信息,特别是移动互联网时代,摄像头拍照的地方可以在斑驳的树影下,也可以在昏暗的街灯下,以及深夜出租车内,这对算法的鲁棒性考验极大。同时还要考虑照片和视频欺诈,二次成像的光线污染等问题。
下面说一下目前人脸识别的常见问题:
[h1]1:1人脸识别算法主要用于身份验证[/h1]1:1人脸识别技术主要是利用图像处理技术从图像中提取人像特征点,利用生物统计学的原理进行分析建立数学模型,即人脸特征点模型。再从人脸特征点模型与被测者的人的面像进行特征分析(可以假定为无数的几何特征点求解),根据分析的结果来给出一个相似值,通过这个值即可确定是否为同一人。简单的说就是A/B两张照片比对,产生的计算数值是否达到要求。
所以没有阈值说明的算法都是耍流氓。 1:1主要用于快速的人脸识别比对,作为身份确认的一种新方式,比如考生身份确认、公司考勤确认、各种证件照和本人确认,由于这些照片源不一定有权威统一的接口调用,所以一直没有用起来。目前市面上做的比对来源主要有三种方式: 1. 用户自传照片,比如支付宝的人脸比对,用户自传的照片最大的问题是照片质量的合格率太低,拍照的光线、角度等因素会导致采集源的质量下降,不利于后期的大批量人脸特征码管理。 2. 使用身份证读卡器,读取身份证上的照片,遗憾的是这张照片2K的大小,不过也是目前用最多的源照片提取方式,比较适合签到场合。 2016给国内一些会议培训公司的识别软件(用于验证会员是否有效以及是否本人):这个值我们称之为阈值,可以从1到100(100就是极端严苛)很多人脸识别公司说他们的产品很容易通过,那只说了一半,如果阈值调整到5以下,几乎大部分人都可以是相似的,而调整到95以上,同一个人在不同的背景环境拍出的照片都无法匹配。所以当一公司跟你吹牛算法准确度,先问下使用的是用什么阈值,同一人脸比对通过率,非同一人比对通过率。
3. 使用公安部旗下NCIIC的人脸比对接口(注意,不是网纹照片接口,这个接口已经不对外),使用的是直接的人脸比对接口。目前具备有这个库调用权限的,目前所知的只有几家,在人脸识别公司中,好像只看到一家在提供,这里先不提了。BAT应该都还没有接入,如有大家有新发现的可以补充。
实际上,解决比对源的问题的关键是需要有权威的照片数据来进行比对,许多公司刚刚开始的时候采取NCIIC(公安部的一个事业单位)身份证返照接口的照片,进行消网纹处理进行比对,但人脸的很多特征点被损毁成功率大概只有6成(根据六月份发布的网络安全法,目前网纹返照接口市面上除了银行系统可以使用外,其他所用的身份证返照接口都是非法的,一用就被查)。
[h1]1:1 人脸识别算法主要使用场景[/h1]
[h1]人脸识别的破解:[/h1]许多金融公司喜欢把人脸识别SDK模块嵌入到APP当中,但这个太容易绕过,所以会再加上活体检测(市场上常见的活体检测为随机动作配合),但是即便加了活体检测,也一样可以绕过。比如下面这两种方式:
1. 3D人脸仿真面具
2. 人脸模型实时重建
所谓道高一尺魔高一丈,这个还是增加其他的多维校验才能确认身份,否则真有人要进行远程攻击,也不是很难的事情。那么活体检测哪家强了?
[h1]1:N人脸识别算法主要用于人脸检索[/h1]跟1:1的A/B两张照片比对最大的区别是A/B A/C A/D……多个1:1计算,这个最大的问题是一旦BCD总和数量越大计算速度越慢,而总和超过20万,就回出现多个相似结果(20万人这个大数会导致有不少人长相相似),需要人工辅助定位。过去我们在电影里面看到什么“天网”识别系统只是一种理想状态,实际应用中都是排列出多个结果,排第一的未必是需要的人。
1:N人脸识别算法主要用于排查犯罪嫌疑人、失踪人口的全库搜寻、一人多证的重复排查,以此相似度列出相应的结果,可以大大提高排查效率。类似的也可以用到走失儿童的项目中去。
这一类系统的部署需要两个条件:
1. BCD基本库(比如1000万人)
2. 强大的算法硬件
1:N同时作业就是N:N了,同时相应多张照片检索需求,检索耗费的时间跟硬件算法关系极大,就这一领域的应用,又哪家公司强了?
[h1]N:N人脸识别算法主要用于实时多1:N检索计算: [/h1]N:N 该算法实际上是基于1:N的算法,输入多个求解结果。比如视频流的帧处理所用,对服务器的计算环境要求严苛,目前的算法系统所支撑的输出率非常有限。
主要的限制如下:
海量的人脸照片解析需要大量运算(目前很少看到在采集端直接解析的,都是照片剪裁)
海量的人脸照片传输需要大量的带宽(常见的720布控摄像头抓取最小的人脸照片为20K)
海量的人脸照片在后台检索需要耗费大量的运算(国内主流主机为例,最多到24路摄像头)
由此可见,真正实现“天网”人脸检索,一来要解决数亿摄像头的图片处理,二来需要解决联合库的超算检索,这可不是一般公司吃得消。有些小区和高级场所,对VIP客户的识别和接待比较喜欢这种视频校验方式,但是实际部署使用者会受到摄像头位置、角度,以及多人同时入场产生的问题,而且人脸库会非常有限,不然计算时间长,体验极差,一些所谓的迎宾机通常也就几个人的照片(就是纯粹给领导看的),实用价值大大的打折扣,有戴墨镜或者帽子遮蔽都认不出,毕竟关键特征取样有限。这又有谁强了?
[h1]拍照和直播APP的人脸图像叠加[/h1]
国内比较多的娱乐APP通过对人像图层跟踪处理,也是一个不错的技术切入点,但是产品安装包会比较大,现在做的也只是跟踪技术,属于底层识别,如果复杂一些的需要通过云服务实现,但是服务器算法解析速度和带宽比较难以跟上,也不算是一种靠谱的商业模式。
[h1]人脸识别的技术发展方向: [/h1]在视频级N:N的校验中,如果要提高通过率,很多时候是采取降低准确率的方式,降低算法队列数量;同样在一些比赛中为了降低误识率,大大提高了准确率,所以算法在校验的过程中必须遵循至少一个固定标准,追求的是速度效率还是最高准确率。 [h1]人脸识别算法的应用分类派系:[/h1]结合三维信息:二维和三维信息融合使特征更加鲁棒 多特征融合:单一特征难以应对复杂的光照和姿态变化 大规模人脸比对:面向海量数据的人脸比对与搜索 深度学习:在大数据条件下充分发挥深度神经网络强大的学习能力
[h1]人脸识别对应解决方案方向:[/h1]
个人认为未来人脸识别会让大部分的数据更加真实,而可以通过社会工程学模板做很多分析和改良,比如近期一些科学家利用人脸识别来分析一些人的健康、清晰,甚至是犯罪倾向,或许在未来还可以结合大数据,对我们过去传统的面相分析技术做一个全新的提升,到时候算命先生都要失业了。更多机器人交互、无人机产生的摄像目标锁定分析等科幻画面并不是多遥远的事情。
[h1]关于算法核心研发情况的争论: [/h1]基本上国内每家公司都会说自己的算法牛,实际上有几家有人脸核心算法呢?国内在完全从事算法研究的总工程师人数到目前(2016年)总计不到100人,不过也没有现在问题也不大,中科院计算所山世光教授已经开源了SeetaFace开源人脸识别引擎介绍 - 知乎专栏,没有基础的公司不用太辛苦从零开始在OPENCV基础上做算法升级,相信很快google微软还会有新的算法发布。现在算法基本都是98%以上,这点差距已经不重要,算法核不核心也没有太大问题。大家不用太过于焦虑,产品到应用阶段,单单靠算法可不够,还要考虑实际的使用。
目前做人脸识别的公司很多,集成应用的有数百家,国内的看百度,看融资,看各种报道就差不多了,只是认真沉下心来做事情的公司太少。国内的腾讯和阿里都在做(阿里支付宝用的是自己的团队研发算法,只是特别低调,把名声都留给自己投资的公司,阿里可不止投了一家),国内的公司吹牛逼的、炒概念的太多,就不聊了。这些公司几乎做的都是政府的安全项目,但公司普遍规模都很小,盈利和投资也很少见报道。Facebook公司进入这个领域,主要是进行人群的分类和应用的优化(针对性的市场推广),项目都是作为公司原本业务的一种补充。
所以这个问题到了最后,答案很简单:
人脸识别哪家强并不重要,
未来的竞争不在现在这些战场。
借用雷布斯的话:少一些胡来的人,大家都可以专心做事。
人工智能投资泡沫带来的浮躁,反而让大家都不好好做事情了,所以花了时间整理了这篇,泼了点冷水,期待同行们真真正正为社会提供一些有价值的,也有资本回报的产品。
更多关于人脸识别的将分段更新【人脸识别技术】:
https://www.douban.com/doulist/79693888/
本篇收录到【人工智能指南】更多关于人工指南的阅读可以参考:
https://www.douban.com/doulist/46106084/
之前的阿尔法狗学习了很多(如果阿尔法狗教人类下棋,会比人类围棋师傅要厉害么?),前两天还回答了个关于机器学习处理马赛克的问题(在五到十年内,人工智能能复原成人影片中的被马赛克部分吗?)。
人脸识别是我比较喜欢的内容之一,而最近,被称作人脸识别“世界杯”的微软百万人识别竞赛第二轮落下帷幕,让人看到中国在这个领域取得的快速进展,激动不已。
今天就聊聊这个人脸识别问题。
记得当初最强大脑里,有人可以快速辨认很多人脸,惊呆了很多人,让观众纷纷感慨人脑的强大之处。
然而,现场的人脸毕竟是有限,而且也只是那个极个别的人可以实现一定程度的识别。放在今天对人脸识别巨大的需求情况下,光依靠人力明显是不可能的。
而这个时候,感谢机器学习的进步,使得我们可以用更好的算法来让电脑执行人脸识别,而人脸识别也随之取得了更多的进步。
(机器学习过程)
如今,人脸识别已经有了取得了长足的进步,而为了方便大家的进步和交流,目前有不同的机构都成立了相应的面部图像数据集。
[h1]————一,微软百万名人人脸数据库————[/h1]我们知道机器学习的一个重要内容是学习,因此可供学习的样本是十分关键的。一般常见的社交网站比如Facebook,新浪微博等都拥有大量的照片,然而他们的数据是保密的,所以大部分人无法获取,因此很多人转向了可以公开使用的数据库。
在公开的人脸识别数据集里,比较著名的是LFW和MegaFace。
LFW是是美国马萨诸塞大学的一个数据集,有1万多张照片,属于相似度比较的范围。
MegaFace是美国华盛顿大学发布的数据,内容是几十位互联网明星照片加100多万张普通人的照片形成的干扰数据。
然而这两个数据集都存在一些问题影响了人脸识别的效果。
LFW由于数据太小,导致往往出现过拟合问题,且实践过程是两张图片相似性的对比;MegaFace本身更倾向于人脸验证问题,且由于MegaFace本身未进行人为标注,导致测试过程中容易出现大量的干扰噪声。
有鉴于此,微软亚洲研究院(MSRA)于2016年发布了一个全新的数据集微软百万名人数据集(MS-Celeb-1M),这个数据及首先保证了照片的数量,包含了10 万个名人的约 1000 万张脸部图片,除此以外,微软更是对照片进行了人工标准,比如标注了职业和性别等选项,这样可以最大程度上避免对应错误的情况。
我们可以用一张图来对比这三家的内容
由于微软的数据库具备了很多优势和改进,因此这个数据库一发布就受到了众人的青睐,如今已经是世界上规模最大、用户最多的图像识别数据集之一。
[h1]————二,人脸识别竞赛世界杯————[/h1]为了鼓励众人对人脸识别的参与,微软还组织了人脸识别竞赛(Image Recognition Challenge),这场竞赛也成为人脸识别的顶级盛宴,被称作人脸识别世界杯。
人脸识别竞赛的要求很简单,就是输入一张人脸,要求输出一个人名。这是一个标准的“端到端”问题,是一种最接近于现实的人脸识别,我们看到一个人,然后知道他的名字。
而根据是否可以自由的使用外部数据,微软又将竞赛分为无限制类和有限制类两部分。前者可以自由的使用外部数据来进行辅助或者训练识别。
而经过紧张的比赛,7月18日,比赛落下帷幕,最终结果呈现给公众,我们可以在相应的网站上看到比赛结果。
Leaderboard of MSCeleb1M @ ICCV Workshop 2017
来自松下-新加坡国立大学(Panasonic-NUS)的团队和来自中国的猎户星空团队(Orion)分别摘得了无限制类和有限制类的冠军。
————无限制类冠军————
冠军是来自新加坡松下研究院和新加坡国立大学联合组建的队伍,两家的标志都是蓝色的,蛮有意思的。
这个团队是深度学习与计算机视觉领域的最顶级团队之一,尤其是在人脸识别方面,更是屡次斩获成果,他们曾经用LFW数据集实现了高达99%的识别效果。而这一次在微软百万名人人脸识别竞赛上独占鳌头,证明了他们的实力处于世界顶级。
在此次竞赛单元中,他们选择的是“Low-Shot Learning”,这是一个非常考验在面对稀缺人脸训练样本的时候,如何精确识别的问题。
在这个测试里包括两个库,基础库(base set)是包含了2万个名人,每个人提供了50-100张左右的人脸;而另一个全新库(novel set)要小得多,只包含了1千个名人,且每个人只有1张照片。尽管最终的给出的考察样本是两者都有,但是明显对于全新库的考察更为关键,也就是稀缺训练下的模型识别效果。
这种情况下,尤其考验策略,NUS-Panasonic组采取的是用基础库来训练模型然后去识别全新库的办法,且充分利用了竞赛允许的额外数据来增强学习和训练。
————有限制类冠军————
来自猎户星空团队(Orion)。
这个蛮有意思的,一个来自中国的公司团队,是猎豹移动旗下人工智能公司。2016年9月才成立,然后不到一年就参与竞赛并夺得了有限制类的冠军。不得不感慨后生可畏啊。事实上在年初的LWF人脸识别的评测中,这个团队就已经崭露头角,拿到了前三名的成绩。
而在此次微软百万名人人脸识别竞赛中,猎户星空更是接受了hard模式。因为有限制的竞赛只能使用微软提供的数据,这无疑增大了难度,因为对于可以使用其他数据的无限制类比赛,某种程度上就是数据量的比较,只要使用足够多的数据进行足够多的模型训练,一定会获得一个很好的学习效果。而限制类由于数据确定,因此更多的是算法层面的比较。结果无论是在random还是hard 中,他们都取得了第一的成绩。
[h1]————三,人脸识别路上的中国龙————[/h1]事实上,这次竞赛中,不止有猎户星空一家中国面孔。
位列无限制类竞赛的第二名,就是一家中国的团队,
来自中国科学院重庆绿色智能技术研究院,这是2011年才成立的一个非常年轻的研究所,由中国科学院,国务院三峡办和重庆市政府联合建立的中科院直属机构。
在此次竞赛中,他们一举夺得了第二名的成绩。事实上,他们还是去年的冠军。
在人工智能领域,中国正在快速的进行追赶,甚至可能实现弯道超车。
根据普华永道预测,未来全球GDP将借助于人工智能的东风取得长足的进步,而中国和美国或许会成为人工智能的最大赢家。
以国际计算机视觉与模式识别会议(CVPR)为例,这是IEEE一年一度的学术性会议,是世界顶级的计算机视觉会议,是人工智能领域的A类会议,每次都是高手如云汇聚一堂。
而在CVPR当前公布的接收论文名单里,华人学者占据了近一半。
而在主席团里,也有不少熟悉的面孔,组委会一共25人,里面可以看到的熟悉的名字就有9人。
此次微软百万名人识别竞赛中,我们看到了华人的力量,无论是限制类的冠军猎户星空,还是无限制类的亚军中国科学院重庆绿色能源研究院,都展现出了无比快速的进步,尤其是猎户星空,成立不到一年就夺得了冠军。这是一家公司,让我们看到了在人脸识别领域,科技公司和资本的力量,事实上,此次参加CVPR会议的公司里,我们熟悉的那些互联网公司不少都参与了,比如阿里巴巴,腾讯,大疆等
短短几年之间,人脸识别取得了突飞猛进的发展,这一方面得益于人脸是别的需求市场非常庞大,随着平安城市的大力推广,安防市场对人脸识别的需求迅速升温,再加上我国城镇化程度越来越高,使得人口流动性也随之增高,这种情况下,光靠传统的人工监控,无论是精力还是准确度,都受到了挑战,因此对人脸识别的需求势必增强。而另一方面,得益于机器学习取得的进展,这几年以机器学习为代表的人工智能取得了长足的进步,尤其是google 研发的阿尔法狗以高超的算法和强大的学习训练能力,在围棋界连续击败人类,更是让人们意识到了机器学习的巨大前景。
在这种情况下,依托于机器学习的人脸识别,无疑也跟着插上了飞跃的翅膀。从这次比赛涌现出来的以猎户星空为代表的中国科技公司和技术力量,更是展现出了在这个领域的进展和追赶。
相信在这个领域,会有越来越多的技术力量进入,为人们的生产生活提供更多便利。
参考资料:
人脸识别界的“世界杯”榜单出炉,中国参赛团队位列第二
践行人工智能发展规划 创业公司猎户星空实力“秀肌肉”
2017年3月20日回答的,根据最新的行业发展趋势,本人反对这个答案,看未来几年究竟是谁预测得对。 实质上,个人认为所有看衰语音和人脸的知乎用户绝大部分现在没有在一线企业任职。 人脸和语音已经是AI领域最接近落地的技术,大规模应用也已经开始,进展速度令人欣喜。 支持以项目和产品说话,反对继续搞刷分宣传。 大家注意了,一般只说自己刷分能力强的产品化能力必定很弱。 ====================================================================================== 第一、一切第三方评测都是纸老虎(就行业应用而言) 目前还没有针对该领域的第三方评测,所以我臆测题主所说的第三方评测是指LFW等数据库。 LFW、FDDB等只能测试算法、刷成绩,没有其它用处。 哪家强?如何比较,第三方数据库权威的话直接拿LFW成绩去投标就行了,为何大多数项目还要单独的POC测试? 那是因为真实复杂场景与数据库场景是完全不一样的!(业内的应该都清楚这一点,再拿LFW、FDDB等成绩出来说事,那真的只是纯粹为了炒作,比如前段时间的某企业刷新LFW纪录,呵呵)就像学术研究与产业化还有很遥远的距离一样。 第二、为什么说这些数据库没啥用? 1、数据少,以LFW为例,只有5000多人的1W+图像,被众多厂商拉出来反复那啥,早就摸透了规律,对算法进行针对性优化。这种算法换个场景一样傻眼。 2、不是所有人都会刷榜,FACEBOOK这些企业一般是刷一次测试一下算法就闪人,还有更多的企业并没有在这些个数据集上跑数据。 3、没人会随时刷榜,事情那么多,还不赚钱去?一般的厂商刷个几次,能拿个第一或并列第一可以炒作就跑了。 新来的一看,咋识别率这么低,我轻松超越一丢丢,哈哈。 就这样反复,于是有好多个第一出现了。 这事还是没算法的公司懂行,管你们算法好不好,买个过来提升设备附加值,设计一个简单不容易出状况的应用场景,赚钱最重要。 3、与真实应用场景出入大。真实应用场景会有各种各样的情况,摄像头位置不理想、客户要求奇葩(如要求隐蔽式非接触打卡)导致抓拍图像不清晰、有遮挡、侧脸、帽子、眼镜,动辄几万人,数十万百万的库,情况比数据库恶劣很多。并且在某些需求中,识别率的要求并不是第一位,一个好的场景设计才能最优的发挥新技术的特点。 比如人脸识别迎宾和预警,很多企业吹得很牛逼,但是即使计算有数据库那么高的识别率99%+,那么问题来,剩下的1%遇上十万人的库,警察叔叔还睡觉不?这能用吗? 第三、行业确实发展很快,但国内算法差不多的就那么几家。 排除一众日德等国外技术的采购商,国内自己做算法而且做得还行的就那么几家。 没有谁强谁弱,大家在项目POC测试中都是互有胜负,还不能压倒性的优势。人脸识别和语音识别实际上都是一种基础型的算法,并不具备行业纵深能力,任何围绕这个概念展开的投资,在未来几年一定会失败!!!