面部识别软件可能存在种族偏见问题

  凤凰科技     |      2018-06-22

在洛杉矶北部的16个“秘密地点”,数字眼睛注视着公众。这些不是普通的警用监控摄像机;这些摄像机正在看着你的脸。使用面部识别软件,摄像机可以识别600英尺以外的个人。然后,他们收集的面孔被实时与涉嫌帮派活动或持有公开逮捕证的“热门名单”进行比较。

考虑到洛杉矶各地的逮捕和监禁率,这些热门名单很有可能不成比例地牵连到非裔美国人。而最近的研究表明,面部识别技术背后的算法可能会在这种人口统计中表现得更差。与其他种族相比,面部识别系统更容易误识别或无法识别非裔美国人,这种错误可能导致无辜公民被标记为犯罪嫌疑人。尽管这项技术正由全国各地的执法部门推广,但对这种偏见的探索或纠正却很少。

21世纪初,州和地方警方开始使用面部识别。早期的系统是出了名的不可靠,但是今天芝加哥、达拉斯、西弗吉尼亚州和其他地方的执法机构已经获得或者正在积极考虑更复杂的监控摄像机系统。这些系统中的一些可以捕捉路人的面部,并实时识别他们。佛罗里达州和南加州的郡长部门已经配备了智能手机或平板电脑面部识别系统,可以用来运行司机和行人对抗照片数据库。事实上,佛罗里达州和其他几个州把每张驾照照片都登记在他们的面部识别数据库中。现在,只要点击一个按钮,许多警察部门就可以在摄像机下辨认犯罪嫌疑人,核实没有出示驾照的司机的身份,或者在国家驾照数据库中搜索逃犯嫌疑人。

但是和任何新兴技术一样,面部识别还远远不够完美。公司将人脸识别技术营销为“高效、准确的工具”,识别率在95 %以上。“实际上,这些说法几乎无法证实。警察使用的面部识别算法在应用于普通市民之前,不需要经过公开或独立的测试来确定准确性或检查偏差。更令人担忧的是,对这些系统进行的有限测试揭示了一种种族偏见模式。国家标准与技术研究所( NIST )每四年对面部识别供应商进行一次自愿测试。2010年,NIST观察到,每轮测试之间的准确率提高了十倍,这是技术快速进步的戏剧性证明。

但研究表明,提高的准确率分布不均。相反,许多算法在种族、性别和其他人口统计学上显示出令人不安的准确性差异。由NIST供应商测试组织者之一共同撰写的2011年研究发现,在中国、日本和韩国开发的算法比高加索人更容易识别东亚人的面孔。法国、德国和美国开发的算法则相反,它们在识别高加索人面部特征方面明显更好。这表明创建算法的条件——特别是开发团队和测试照片数据库的种族构成——可能会影响其结果的准确性。

同样,2012年进行的一项研究也发现了种族偏见的证据,这项研究利用佛罗里达州皮涅利亚斯县收集的马克杯照片来测试三家商业商贩的算法。在被评估的公司中有connotec,其算法被加州、马里兰、宾西法尼亚等地的警察使用。这项由FBI资深技术专家共同撰写的研究发现,这三种算法在非裔美国人身上的表现始终比高加索人差5 %至10 %。有一种算法,在与高加索人的10次相遇中,有1次未能识别出正确的人,但在拍摄非洲裔美国人的照片时,失败的频率几乎是前者的两倍。

这种偏见尤其令人不安,因为在全国各地的警察交通停车、停车和搜查以及逮捕率方面已经存在巨大的种族差异。非裔美国人被捕的可能性至少是美国其他种族成员的两倍,而且据估计,成为警方监视目标的可能性高达2.5倍。马克杯照片数据库和监控照片中的这种过度呈现将加剧准确率差异5 %至10 %的影响。换句话说,不仅是非洲裔美国人更有可能被人脸识别系统误识别,他们也更有可能在这些系统中注册并接受处理。

想象一下,警方正在调查一起被拍到的抢劫案。当他们对照他们的面部识别数据库运行犯罪嫌疑人面部的静止视频时,他们得到了10个可能的匹配,但是没有一个与犯罪嫌疑人完全匹配。尽管如此,最接近的一场比赛被视为领先,警方开始调查一名无辜者。由于当今人脸识别算法的准确率偏差,这种情况在统计上更有可能发生在非裔美国人身上,而不是白人身上。

这并不是说面部识别算法是“种族主义的”,也不是说种族偏见被有意地引入到它们的操作中。相反,在设计和部署面部识别系统的过程中,这些显示的差异可能会无意中在多个点引入。开发一种算法的工程师可以将它编程为关注某些种族比其他种族更容易区分的面部特征——人的眼睛形状、鼻子宽度、嘴巴或下巴的大小。这一决定反过来可能是基于先前存在的关于人脸识别的生物学研究和过去的实践,而这些研究和实践本身可能含有偏见。或者工程师可以依靠自己的经验来区分面孔——这一过程受到工程师自身种族的影响。

此外,算法学习如何通过在预先存在的人脸训练集上练习来计算照片的相似度。因此,即使算法关注的特征是种族中立的,包含不成比例数量的一个种族的训练图像集也会在那个方向上偏向算法的准确率。2012年的mug shots研究发现,一种专门针对非裔美国人或高加索人面孔的算法在训练集中比任何其他种族的成员更容易识别种族成员。

不幸的是,这里讨论的两项研究是过去十年来发表的关于种族偏见的唯一著作——对于一项有能力将人牵连进刑事调查的技术来说,审查太少。NIST非常适合领导一套全面的偏倚测试的开发,这些偏倚测试可以与其现有制度一起构成面部识别系统的正式认证框架的基础。但是NIST对面部识别系统的测试是自愿的。执法机构——或者支付账单的市议会和州立法机构——完全有条件要求面部识别软件供应商提交NIST现有的准确性测试以及它开发的任何新测试。

在这些要求到位之前,面部识别供应商应该自愿将他们的算法提交给NIST现有的测试制度和其他公开的同行评审研究,以测量并开始纠正算法中的种族偏见。

与此同时,正在对全国各州和地方执法机构使用面部识别技术的情况进行深入研究。我们的研究基于对发送给100多个部门的信息自由请求的响应,旨在清楚地了解这些系统的外观、使用方式和使用对象,以及有何政策和法律标准(如果有的话)限制这些系统的使用。将于今夏发表的最后报告将包括向联邦、州和地方各级政府、执法机构本身、公司和倡导者提出建议,说明如何确保这项技术的使用符合所有公民的隐私和公民自由利益,而不论其种族。