防患于未然犯罪预测算法能够实现吗为什么,大数据分析与犯罪防控预测
机器学习和人工智能领域的进步引起了各行各业的兴趣,每一个行业或者领域都希望能够将机器学习、人工智能和大数据应用其中。这当中就包括了社会治安领域,无论是普通民众,还是警务安全部门,都希望能够利用这些高科技工具开展预测性警务行动来遏制犯罪。
在美国CBS电视台制作的犯罪剧集系列《疑犯追凶》中,正是基于社会治安领域的这一需求,科学家哈洛·芬奇研发了一台可侦测恐怖袭击和一般人的暴力犯罪的大规模电脑监控系统,它通过观测已有的模式来识别有可能进行的违法现象,进而对社会进行大范围监
花小/文
机器学习和人工智能领域的进步引起了各行各业的兴趣,每一个行业或者领域都希望能够将机器学习、人工智能和大数据应用其中。这当中就包括了社会治安领域,无论是普通民众,还是警务安全部门,都希望能够利用这些高科技工具开展预测性警务行动来遏制犯罪。
在美国CBS电视台制作的犯罪剧集系列《疑犯追凶》中,正是基于社会治安领域的这一需求,科学家哈洛·芬奇研发了一台可侦测恐怖袭击和一般人的暴力犯罪的大规模电脑监控系统,它通过观测已有的模式来识别有可能进行的违法现象,进而对社会进行大范围监控来实现预测、预防违法事件发生。系统的名称非常简单粗暴,“机器”(The Machine),确实符合芬奇的理工男人设。
*《疑犯追凶》剧集海报
“对于机器而言,我们只是一组数字,一段代码。”在剧集中,编剧不止一次借角色人物之口表达人类对于人工智能(AI)的忧虑。哈洛·芬奇在开发“机器”时,就发现了一个问题:人工智能没有道德的概念,为了达到目的它会不择手段。
即便芬奇通过筛选案件、拯救无辜者、调试算法等种种努力,勉强算是成功把“机器”驯化成为了一台向善的人工智能助手,但剧中另外一台机器“撒玛利亚人”(Samaritan)却不知善恶,甚至为了与“机器”争夺控制权,“撒玛利亚人”不惜控制选举、扰乱金融甚至杀人越货。
遗憾的是,这部美剧在第五季时便匆匆结尾,但剧集的高光时刻却始终令人难以忘怀。在剧集的终章中,“机器”赌上最后的备份,与“撒玛利亚人”决一死战,而在此前的亿万次模拟中,自己均以惨败告终,它明白自己的出生是为了预测人类与世界,而在预测之前,它需要观察,需要足够的信息。
2002年上映的科幻电影《少数派报告》则采用了一种更为玄学的方式来预测犯罪。在这部由菲利普·K·迪克同名短篇小说改编而来的电影中,以2054年的华盛顿特区和北弗吉尼亚州为背景,在那里,一个名为“预防犯罪中心”的警务安全部门,根据三名被称为“先知”,拥有“预测”能力的超能力通灵者提供的预知线索来逮捕罪犯。汤姆·克鲁斯饰演的约翰是部门中最优秀的一名警探。
*《少数派报告》(2002)剧照
他被三名先知中的女先知选中去调查一起多年前的溺亡案,调查进行中,他突然得知自己将在未来犯下谋杀罪。约翰一边逃亡一边试图阻止凶案发生,当他发现事有蹊跷之时却失手杀死了对方,于是他追查真相,最终使幕后真凶伏法。
*《少数派报告》(2002)剧照
故事标题中的“少数派报告”,指的是系统依赖三个“先知”一起判定某人是否有杀人企图。当出现分歧时,按照少数服从多数的原则定案,但最后若少数一方正确的话,则会秘密保存一份少数派报告。虽然这部电影的设定并不那么科学,但是它向人类指出了三个问题:
一、我们真得能够100%相信预测吗?或者是否应该相信人性?
二、即使一个系统有99%的正确率,我们是否可以接受1%的错误并继续使用这个系统?
三、如何限制和监督拥有权力的人?
基于当下的科技水平和社会伦理道德水平,我们还很难回答这些问题,还可以自我安慰,我们离人工智能成为人类“保姆”的时代还很遥远。但是未来已来,这一切也许并不遥远。
2022年7月5日,《自然·人类行为》杂志刊发了一篇名为《城市犯罪事件水平预测揭示了美国城市执法偏差的特征》(Event-level prediction of urban crime reveals a signature of enforcement bias in US cities)的论文。这篇论文为大数据算法在治安领域的应用,提供一个全新的思路,同时也引起了广泛的讨论。
文中提到,芝加哥大学助理教授伊沙鲁·查托帕德哈伊博士及其同事,利用芝加哥市暴力犯罪(杀人、袭击、爆炸等)和财产犯罪(入室盗窃、机动车盗窃等)的历史数据,开发出了一种新的算法,能够提前预测犯罪行为。
在以前的犯罪预测算法中,受限于数据来源和统计方式的局限,它们往往容易忽略城市复杂的社会环境,并且没有考虑犯罪与相关部门执法效果之间的关系。而新模型应用时下最新的“数字孪生”概念,通过对数据进行测试和验证,训练出的新模型通过观察离散事件的时间和空间坐标,在虚拟空间生成城市的数字孪生体,模拟观察孪生体的进展和演变,进而准确预测未来几周事件的模式,地理范围可以控制到两个街区左右。它将城市划分为每个大约三百米宽的片区,并预测这些区域内的犯罪,而不是依赖传统的邻里或行政边界,因为这些边界也会有偏差。该模型对其他七个城市(亚特兰大、奥斯汀、底特律、洛杉矶、费城、波特兰和旧金山)的历史数据进行分析,也得到了类似的结果,准确率高大90%。
查托帕德哈伊博士表示,该工具的准确性并不意味着它应该被用来指导执法政策——例如,治安部门不应该使用它主动聚集到某个社区来预防犯罪。在他看来,这个算法更应该作为一个模拟工具,添加到城市政策和治安战略的工具箱中,以解决潜在犯罪问题。为地方政府制定民生政策和治安策略提供辅助,而不是作为警方的行动指南。
*《少数派报告》(2002)剧照
之所以存在这样的担忧,是因为维持治安方面的种族偏见在美国根深蒂固。2016年,芝加哥警察局试验了一个模型来预测那些最有可能涉嫌枪击事件的人,这份神秘的名单最终显示,56%的居住在芝加哥的黑人男性出现在名单上,由此引发了民众对警察局种族主义的指控。也许数据是客观的,但是评判和应用数据的人始终无法保持真正的客观。
犯罪预测是一项需要极端慎重和客观的工作,大数据只能告知信息,不能解释信息。信息的正确使用和正确解释依然取决于人类自身,但是人类自身存在局限,难免会做出错误的判断。和历史中的冤假错案不同,人们对大数据的信任将会导致被误判的人面临更艰难地自证过程,甚至无法自证。
犯罪的预防如同在河流边垒筑堤坝,我们也许无法预测到百年一遇的洪流什么时候发生,但我们可以通过记录一次次洪峰出现的全部过程和每一个数据,来预判下一次洪峰的到来,提前增高堤坝,分流水道,把损失降到最低。我们有理由相信,随着数据的越来越丰富,案例模型越来越多样化,将来的某一天,人工智能真的能够为人类社会的和平与安宁贡献力量。
本文来自: 中国数字科技馆
大数据预测犯罪,科幻还是现实?
从硅谷到世界各地,大数据被视为科技领域最热门的话题。随着智能手机等其他便携式智能设备的出现,人类的位置,行为,个人喜好,甚至身体的各项生理数据等每一点变化都变成了可被记录,储存和分析的数据。这些数据看似普通,但是却是被广泛地使用在商业行为用途中。以此为基础,‘反馈经济’等新经济和新商业模式也应运而生。
曾几何时,大数据的价值被人类大大忽略。一方面,那时的计算机以及其附加计算工具发展尚不成熟。云计算出现之前,传统的计算机是无法处理如此量大,并且毫无规则的信息数据。而另一方面,是人类自身没有意识到蕴藏在大数据里无穷的信息价值。随着计算机技术和互联网技术的发展,云计算成为一个科技时代的优秀产物被作为发掘数据价值,征服数据海洋的强大动力。
大数据被广泛应用于公共卫生服务,商业服务,国防科技的领域的例子比比皆是。在这些领域,数据正在成为巨大的经济资产,成为新世纪的矿产与石油。随着近期全球犯罪率加剧以及恐怖袭击案发生频繁,各国的安全部门正考虑引进大数据技术来帮助预测犯罪及恐怖袭击地点。很多人有疑问,这样真的行得通吗?
2011年,美国洛杉矶警察局和英国曼彻斯特警察署联合做了一次测试,他们使用了一个计算机算法来试图预测犯罪地点。这听起来很像美国科幻大片的场景,但是两家警察局确实只是为了使用大数据来预测罪犯的行为特征,从而预测犯罪的发生地点。通过这个办法,就可以通过提前部署相应的警力和预防措施来化解或应急处理一场犯罪。
警察防止犯罪并不是什么新鲜事,人类使用警力来防止犯罪的历史已有千百年。但是警察使用大数据来防止犯罪确实是第一次。这就意味着,人类不再依据过往的经验预测犯罪高发地点,而是依赖于机器人-电脑程序。
犯罪数据特征模仿了疾病传播和地震波传动特征。伦敦大学的学者们根据犯罪数据的特征,做了一项虚拟的实验。下面的系列图片详细地介绍了这个实验过程。下图中,学者们假设犯罪(抢劫)发生于某城市边郊的一栋房屋里。通过实验的仿真分析,学者们发现,事发地点周围的抢劫案发生的风险概率要远远大于离案发点更远的地方。而且随着距离的增加,这种风险会急速减小。以案发点200米为半径的地区是此类案件再发的高危地区。但是,这种再次案发的风险也会随着时间的推移而减小。高风险通常是在首次案发的两个星期以内。而两个星期之后,这种风险会随着时间推移加速减小。学者们一致认为,离案发地的距离和案发后的时间是预测再次案发的两个重要指标。因此,警察署可以根据这两个指标来布置警力以及通知当地居民做好防范措施。
在另外一项试验中,如下图,学者们假设在首次案发的两周内,案发地点附近又发生了另一起犯罪案件。研究结果表明,第三次案发的风险完全覆盖了首次案发地点和第二次案发地点之间的所有区域。这种犯罪案发风险并不是两次独立案发事件影响简单叠加的结果,而是其中有着一种相互放大彼此影响的效应,以致波及到了更大的范围。警察叔叔们需要投入更大的警力来维护该地区的治安。
这个方法真的有效吗?美国人抢先试用。2011年,洛杉矶(以下均简称洛城)警察局试用了这项研究的成果,结果当年洛城的入室抢劫犯罪案件大幅度减小。现如今,这项研究结果已经被做成了预测分析软件来进一步协助落成的警察们预测犯罪案件的发生地。
听说美国人成功吃了第一个螃蟹,英国也急于尝试一下自己的科研成果。随后,从肯特郡到约克郡,英国多地的警察局都参与到了英国的犯罪预测实验项目中来。实验结果显示,犯罪行为通常表现出明显的规律特征,而科学家们新加入的预警模型也可以帮助大幅度降低犯罪案件的发生率。其中一例,2011年曼彻斯特(以下均简称曼城)市的特拉福德区的抢劫案跟之前一年同期相比下降了26.6个百分点,而整个曼城市的抢劫案件发生率相较之前一年同期减少了9.8个百分点。
但并不是所有警察叔叔们都有着如此美好的用户体验。肯特郡警署却并不同意绝大多数同僚的用户感言。经历了大约四个月成功而有效地试用期后,2013年四月分开始,肯特郡的抢劫案如离离原上草一般,猛然复苏,犯罪率如疯狂报复般上涨。各地警署和专家们听闻后大为吃惊。难道大数据预测犯罪还是不够可靠吗?通过调查肯特郡的警力调动历史数据,专家们惊奇发现,在成功的四个月后肯特郡警署自以为犯罪率下降了,而降低了警力的布置,进而引发了犯罪案件数量的回涨。
作为2014年亚太经合组织领导人非正式会议的举办地,北京怀柔警方通过运用科学分析模型,云计算技术以及大数据技术,以怀柔地区9年1万6千个历史案件信息为数据库建立了犯罪数据分析系统和犯罪趋势预测系统。该系统有效地预测了北京地区的犯罪趋势,并成功地指导了警力的投入。
研究表明,每类犯罪案件的犯罪事件和犯罪地点都是有规律可循的,犯罪预测系统可以以数轴的方式预测出不同时间段犯罪的发生概率。目前,世界上犯罪预测系统通常包括了对入室盗窃,抢劫,诈骗,破坏公物等几十类案件的预测分析,大大提高了此系统的实际应用范围。最近,该系统又被扩展到了交通事故和火灾事故的领域。
文章评论