北美大学生建模B题译文 个人翻译.docx

上传人:b****6 文档编号:4388079 上传时间:2022-12-01 格式:DOCX 页数:14 大小:235.69KB
下载 相关 举报
北美大学生建模B题译文 个人翻译.docx_第1页
第1页 / 共14页
北美大学生建模B题译文 个人翻译.docx_第2页
第2页 / 共14页
北美大学生建模B题译文 个人翻译.docx_第3页
第3页 / 共14页
北美大学生建模B题译文 个人翻译.docx_第4页
第4页 / 共14页
北美大学生建模B题译文 个人翻译.docx_第5页
第5页 / 共14页
点击查看更多>>
下载资源
资源描述

北美大学生建模B题译文 个人翻译.docx

《北美大学生建模B题译文 个人翻译.docx》由会员分享,可在线阅读,更多相关《北美大学生建模B题译文 个人翻译.docx(14页珍藏版)》请在冰豆网上搜索。

北美大学生建模B题译文 个人翻译.docx

北美大学生建模B题译文个人翻译

摘要

在本文中,我们提出了一个计算机模型来预测基于地点和对过去的罪行序列的连环犯罪的下一个可能犯罪地点和住所。

我们首先创建一个“路线度量指标”,以衡量汽车行驶时的距离。

为了预测未来犯罪的地点,我们应用核密度估计的无参统计技术与我们的路线度量指标,其中线路度量指标是允许我们估计一个与时间相关的概率分布函数。

为了预测连环犯罪的地址,我们使用由Rossmo开发的一个精细模型,使之适应路线度量指标。

这种方法开发了一种关于犯罪分子可能的居住地点的概率分布通过平衡以往犯罪地点与观察,离家越远就有越多的机会作案,被抓的几率就越少。

我们把我们的模型应用到多次大规模连环杀人案,即彼得萨克利夫的“约克郡开膛手”案,和“亚特兰大儿童”案的凶手韦恩威廉姆斯。

在这两案件中,我们的模型在预测犯罪地点中取得了成功,并且证明可能在刑事调查中有用。

1简介

在本文中,我们呈现了一个研究犯罪模式的计算机模型。

我们的模型将高速公路系统作为犯罪分子如何犯罪的一个重要的决定因素。

特别的,我们建立了一个路度量来计算司机从地图上的一点到另一点开车要花费多少时间。

我们把这个路度量纳入许多不同的模型中来预测下一次犯罪将会是在哪里发生和嫌疑人住在哪里。

我们的模型给执法部门一种预测在哪里搜查才能最大可能的抓获嫌疑人的方法和。

1.1我们方法的大纲

我们论文的开始给出了我们计算机模型的理论框架和大纲。

后面部分将我们的模型应用到著名的刑事案件中并检验模型的精确度。

对每个案件的调查我们都大致做如下处理

1.建立路度量来计算基于在两地间开车所花费的时间的距离。

这个度量主要基于当地的高速公路系统

2.估计推断下一次作案的可能地点的概率密度函数

3.用基于路度量的一个最合适环路来估计嫌疑人的住所

1.2假设

由于犯罪活动的巨大变动以及几乎所以连环杀人案的凶手通常患有心理疾病,所以采用相对简单的计算机模型去预测连环杀人案一般都面临几个障碍。

以下是应用于我们模型的对犯罪行为所采取的假设:

1犯罪是由个人构成的。

我们假设模型中的案件都是由单独个体作案的,我们的模型不是为有组织的犯罪,团伙犯罪和暴动而建立的。

2犯罪分子都是驾车逃离。

我们模型在分析高速公路模式时有意义,这里,我们通过计算驾车行驶所花费的时间来判断距离。

3作案地点在被发现地点的附近。

在凶杀案中这意味着尸体的发现地点就是作案地点。

这不是个不合理的假设,因为多数连环案件的凶手在作案后会把受害人尸体丢到作案地点附近。

在连环案件中,比如连环强奸案,爆窃或纵火案,作案地点与警方发现地点是没有区别的。

4犯罪发生在一个狭小的区域,比如一个市或县。

这里忽略案件发生在州或国家之间的情况。

在那些案件中,我们的模型必须被应用于每一个集群。

2测绘犯罪和路度量

我们用数学软件Sage来生成一幅案发地点附近的地图。

地图中的主要特征有主要的高速公路线路和案发现场。

我们把高速公路系统看作一个图,把高速路的每个出口入口看作图中的顶点,把出口入口间的公路部分看作图的边。

给相邻两顶点间的边赋一个权值,该权值为两顶点间的欧几里得距离。

2.1路度量

对每一个图M,计算一个路度量d:

M*M—〉R+。

在一个地区内,路度量根据两地开车所花费的时间来计算两点间的距离。

这个方法是建立在司机总是走两点间最短路径和尽量利用高速路而不是走侧街道的假设基础上。

路度量建立连这样的假设:

在侧街道上花费的时间是与曼哈顿度量成正比的,因为侧街道总是被规划成网格形状。

花费在高速路上的时间是与欧几里得距离成正比的。

已知点a,b,我们的道路指标计算如下:

1.对于我们高速路系统的每个顶点V,(对应于高速路的入口或是出口),我们计算曼哈顿距离M(V,a),M(V,b)。

2.对于每一对顶点V1,V2,我们应用Dijkstra算法来寻找图中V1到V2的最短路径(考虑边缘部分的长度),我们把这个距离记做E(V1,V2)。

3.然后我们的路度量定义为:

d(a,b)=min{

{M(a,V1))+E(V1,V2)+M(V2,b))},M(a,b)}

或者换句话说,把它定义为走高速路的最短时间与不走高速路的所花费时间的最小值。

在实际计算路度量时,我们将图分为m×n个网格并计算,然后记录从一个网格空间到其他网格空间的距离。

3估计推断概率密度函数

3.1核密度估计

给出犯罪的地点跟位置,我们对未来犯罪的概率密度分布做出初步估计。

在欧几里得距离情况下,给出一组由随机变量产生的简单点{x1,x2,…xn},则概率密度函数为

其中,

,A为协方差矩阵,相当于在每个点周围添加小正态分布来产生一个概率密度估计函数[7],[10],[2]。

我们发现因为协方差矩阵式正定的,二次型xtAx在Rn上的范数定义为:

,这反过来又。

通过将高斯函数K(如上所示)替换为修改后的高斯函数G,提供了对路度量的一个应用。

其中

,d为上面定义的路度量,h为内核协方差的一个间接控制因子,Mi为正火系数,定义为:

我们把h看成是时间的函数由于近期的犯罪多比早期犯罪更容易估计未来的犯罪的这个假设是合理的,因此通过将h定义为增函数,让修改后的高斯函数在时间上发散。

由经验确定

h(t)=2.5arctan(2t+0.5)t以周为单位,是一个不错的选择。

我们对概率密度函数的估计也因此成为

(1)

在实际计算

时,如同我们计算路度量时,我们在分好的m*n个网格的每一个网格中用预先计算出来的路度量计算

3.2推断未来的概率密度函数

我们以上的叙述给出了一个寻找犯罪地点的合理的方法,但是期望犯罪分子总是根据单个概率密度函数来实施犯罪就不见得合理了。

因此我们决定建立基于上面讨论的概率分布函数的趋势的加权最小二乘逼近。

这个方法使线形逼近概率密度函数并预测数据集以外的概率密度函数。

我们的方法如下:

用x1,x2,…xn表示犯罪地点,分别发生在t1tn时犯罪的发生地点。

1.在我们的方程

(方程1)中,我们将在t时间之前发生的犯罪求和。

2.所以我们的线形逼近与核函数的初始峰值没有偏颇,造成个别谋杀案。

我们希望我们的密度函数尽可能的发散。

使用公式

(1)的概率密度估计,我们得到概率密度函数

,…

尽可能小,

,tM在tn和t*之间。

3.我们现在做加权最小二乘逼近来估计

在m*n的网格上,我们逐点考虑

并进行加权最小二乘。

我们修改众所周知的标准最小二乘问题

的正规方程如在[1]中所述,来得到修改后的正规方程

,W是权值。

我们选择的概率密度函数的权值与时间呈线性关系(所以后来犯罪的权值远大于先前犯罪的权值)。

4.1中心图学

估计连环作案凶手居住地的一个常用的方法是将每一个案发地点看作一个质点,通过空间平均来找到这些质点的中心。

根据参考书【9】,中心图学是最常用的罪犯搜寻方法之一,并且已经被应用于验证圣地亚哥的连环强奸案和约克郡开膛手案件中。

根据参考【4】,大量重要证据表明连环作案凶手往往居住在诸多案发地中心的附近。

4.2最匹配圆圈

在应用图心来分析罪犯居住地的方法中做一个尝试着将犯罪活动地点围成一个圈的合理扩展。

这个扩展基于一个假设:

罪犯会特别避免在距离他们居住地非常近的地方作案,但是于此同时他们在每一起案件中耗费的精力是大致相等的。

因为我们认为罪犯在一起案件中投入的精力与他们花费在路途上的时间成比例,所以应用前面建立的道路度量标准进行分析。

4.2.1第一个尝试

我们所做的最基本尝试是通过取案发地与圆圈距离平方的最小值来找到与数据适配的圆圈。

例如:

取点d与所有案发地xi距离的平方和的最小值。

但是这种方法很不稳定,如图1所示:

找三个点的最适圆圈,一旦中间的点稍作移动,就会最适圆圈的半径和圆心发生极大变动。

 

图1:

基本最匹配圆的不稳定现象

4.2.2改进的最匹配圆

一个更好的推广:

在欧几里德坐标系中,给定一系列点x1….xn,

那么经过

取得最小值,点x即为给定区域的中心。

这种方法使得道路度量标准得到普遍的推广,这也许是对中心图学这种常用方法一个更好的扩展。

即,定义使

取得最小值的点x为最匹配圆的圆心,定义半径r为圆心x到各案发地点的平均距离,即

图2为一个由高速公路系统构成的道路测量标准中的一个圆圈。

该特定的高速公路系统取自苏克利谋杀案件,我们将会在后面的论文中对该案件做详细讨论。

图2:

由英国曼彻斯特利兹市地区曲线所生成道路度量标准中的圆圈,黑色的为高速公路系统曲线,灰色的为圆圈

4.3应用于Rossmo模型

在参考书【9】中,Rossmo提出了根据犯罪活动地点预估罪犯居住地的模型,在该模型中使用了缓冲地带的概念。

缓冲地带是指位于罪犯居住地四周、罪犯避免进行犯罪活动的地带。

缓冲地带的深层含义是指罪犯企图在距离他们住处很远的地方作案所耗费的巨大精力以及在住处附近作案的高风险性两者之间得到均衡。

在参考书【5】【8】的犯罪模型和狩猎模型中,大量研究验证了Rossmo模型及缓冲地带的概念。

Rossmo的模型基于将普通犯罪地点的地图细分为网格,

然后通过

计算凶手居住在在某一特定网格中的估算概率。

其中

,f,g均为常数,B为缓冲地带的半径,K为使整个概率分布标准化的常数。

由经验得出,在犯罪案件中f,g的最优解为f=g=1.2。

在我们的模型中,将Rossmo模型的公式加以改动,以使道路度量标准得以应用。

因此在我们的模型中Rossmo模型公式改为

为了估算缓冲地带的半径,我们用了最匹配圆模型,在我们的度量方法下大致估算最匹配圆的半径,然后将此距离的一半作为缓冲地带的半径估计值。

5.案例分析

这一部分我们应用建立的模型来分析来两个著名的案例,即约克郡开膛手案件(彼得.萨克利夫)和亚特兰大儿童凶杀案(韦恩.威廉姆斯)。

5.1约克郡开膛手案件

约克郡开膛手案是发生在1975-1981年间的一起连环凶杀案,在该案件中,13名女性被杀害,7名女性在英国的曼彻斯特和利兹地区遭到袭击。

被杀害的女性中绝大多数是妓女。

彼得.萨克利夫被认定为谋杀和袭击的凶手。

根据参考书【3】,谋杀之后尸体似乎没有被搬移到其他地方。

我们在分析过程中不再对袭击和谋杀加以区分。

5.1.1地图及度量标准

在曼彻斯特和利兹地区的地图中,我们用曲线图来表示高数公路并确保使入口和出口(曲线的节点)集中分布在人口密集区的四周。

如图3所示:

图为由道路度量标准得出的距离的彩色绘图,从该图中得出凶手萨克利夫的居住地。

Figure3showsacolorplotofthedistanceundertheroadmetricfromwhatwaslaterdeterminedtobeSutcliffe'sresidence.

图3:

该图表示由道路度量标准得出的萨克利夫的房子与附近的公路系统的叠加后的距离。

房屋符号表示萨克利夫的房子,红色对应非常近的距离,深蓝色对应非常远的距离。

5.1.2概率密度估算

萨克利夫共犯下20起刑事案件,我们在前19起案件应用我们的密度分布模型,以此对第20起案件的案发地点做出预测。

通过综合前19起案件作案时间、地点以及第20起案件发生的时间来预测第20起案件的作案地点。

如果用我们的模型进行实际案例分析,下一起案件的作案时间不能得知,但这一因素并不是非常重要,因为我们在核心部分使用的方差函数使模型可以迅速趋于稳定。

预测结果如图4所示。

图4:

该图表示由前19起案件得出的第20起案件案发地点的概率分布,圆点表示先前的案发地,'x'表示第20起案件实际案发地点。

红色代表案发率最高的区域,紫色表示案发率最低区域。

5.1.3Rossmo模型

如前面讨论所示,Rossmo模型用来预测罪犯住处所在地。

我们对该模型加以改进,以便应用道路度量标准。

如前面讨论所示,我们首先用一般的图心计算得出犯罪活动的最匹配圆,如图5所示。

然后用由Rossmo模型方程得出解的二分之一来估算罪犯的藏身之处。

图6所示为一彩色平面图,图7所示为估算的概率函数的平面图。

图5:

符合道路度量标准的犯罪地点的最匹配圆圈,黑色表示该圆圈,灰色的是曲线图,红色表示案发地点。

图6:

由Rossmo模型得出的作案凶手居住地的概率密度分布,红色表示最高概率区域,萨克利夫的实际住处由图中的房屋标志标注出。

图7:

Rossmo模型估算概率的曲面图

Figure7:

Rossmo'sprobabilityestimateasasurface.

5.1.4模型结果评估

核心方法预测的结果明显集中在20起谋杀案实际案发地点附近区域。

根据我们预测出的概率分布,这20起案件发生在包含实际实际案发地点的小区域的概率是发生在普通区域的8.58倍。

更重要的是,我们模型得出的结果可以直接指示执法机关工作人员在准确的案发地点展开调查。

尽管Rossmo模型没有在萨克利夫住处直接生成热区(hotspot),它仍为警方调查提供了一个有利的出发点。

萨克利夫的住处位于第二或第三优先地带,在搜查过程中将会合理、快速得到结果。

5.案例分析

5.2亚特兰大儿童谋杀案

亚特兰大儿童谋杀案指的是发生在1979年到1981年之间的29名儿童和成人被杀的案件。

29人之中仅有22人与韦恩,威廉姆斯有直接联系,所以在我们的模型中只用这些数据要点。

还有一份证据是尸体与他们被谋杀的地点距离并不远。

威廉姆斯在1982年被捕并证明与连环谋杀案中的两起有关而定罪判刑。

5.2.1度量标准和地图

我们使用凶案发生地周围的公路系统图。

和论文先前用到的方法一样,我们把公路系统用曲线图表示并计算这个案例的道路度量标准。

各点与威廉姆斯家的距离如图8所示、

5.2.2概率密度估计

运用模型,对数据中的21个点利用概率函数来预测第22次谋杀案的发生地。

运行结果如图9所示。

5.2.3Rossmof方法的应用

下面是整个模型的详细描述,首先利用亚特兰大谋杀案中数据集合计算最后圆。

结果如图10所示。

图8在公路度量标准之下各数据点与韦恩,威廉姆斯居住地的距离。

图9图示为根据已知21个点的数据信息计算出的第22个点最可能的位置。

第22次谋杀案实际发生地在图中用“X”表示。

应用Rossmo方法的变形来估计罪犯可能居住地的概率分布。

结果如彩图11所示,结果陈述的表面图如图12所示。

5.2.4结果评价

此案例的对于核心方法的应用并不如苏利弗案成功。

模型的运行结果是第22次凶杀案发生在了一个意外的地点。

模型仍然能够为这个地区的第22起谋杀案预测一个特殊的可能,模型运行生成的热点会相当的靠近这个地区。

惊人地,这个热点恰好集中在了威廉姆斯的住处。

图10对于亚特兰大儿童谋杀案数据处理的最佳环路。

图11彩图表示利用Rossmo模型对全部犯罪发生地数据进行处理来预测罪犯居住地点。

图中房屋标识代表韦恩,威廉姆斯的住处。

Rossmo模型能够生成一个非常接近凶手居住地的点。

考虑将模型结果做参考,执法部门可以迅速的找到威廉姆斯。

图12Rossmo方法可能性估计的平面图

6模型的改进

6.1扩展道路度量标准

我们的方法最创新的一点就是精确估计到犯罪地点的代价的道路度量标准的设计。

我们可以通过考虑地图上的其他地理特征来改进模型估计,比如湖泊,河流和不同海拔的地形等。

不同形态存在的水可能会对计算结果存在潜在的重大影响。

6.2受害可能切面图

通过观察亚特兰大儿童凶杀案可知,核心方法不能预测一个相对以外的凶杀地(从纯地理方面)。

我们通过重点对受害密集度高的地区运用概率密度函数来优化模型。

例如,PeterSutcliffe通常的目标是妓女,所以如果某个地区有严重的卖淫现象,我们可以增加这个地区成为潜在的凶杀地的可能性来优化模型。

6.3优化计算效率

算法通过在地图上的这个地区划分为网格并保留任意两个单元之间的距离来节省运算时间。

每一次距离的计算都应用一次最短路算法,计算所有距离的最终结果需要很长时间。

在道路度量标准中通过一个更有效的算法(或者实现比Sage能够得出的结果更快)来测量距离,模型中的网格将会更优,同时模型的计算精度也会有很大的提高。

6.4测试求取最佳参数

由于我们仅用有限时间来计算完成复杂的测试,通过变异函数h得到的以经验为主的决策有可能远不是最优的。

如果选择不同的h模型将会从实质上得到改进。

进一步地,在Rossmo模型中我们选取的参数f和g的值,是曼哈顿岛道路度量标准的最佳值,对于参与计算的道路标准也许会有更合适的参数。

7.结论

通过给出有限数据来处理连环犯罪是非常困难的,最显著的差别是我们的方法突显创造力来解决这个问题。

我们的两个方法都被证明是能够精确计算出他们想要发现的热点的方法。

核心方法在Sutcliffe案中非常可行最可能的原因就是杀人犯有群居作案的嗜好。

然而,对于一致均匀分布的犯罪应用这个方法得到的结果并不很准确。

7.结论

通过给出有限数据来处理连环犯罪是非常困难的,最显著的差别是我们的方法突显创造力来解决这个问题。

我们的两个方法都被证明是能够精确计算出他们想要发现的热点的方法。

核心方法在Sutcliffe案中非常可行最可能的原因就是杀人犯有群居作案的嗜好。

然而,对于一致均匀分布的犯罪应用这个方法得到的结果并不很准确。

在测试案例中Rossmo方法都有很强的预测能力。

它能正确的计算出热点,以使执法部门能够很容易的捉到罪犯。

整合模型,将模型计算所得到的热点均提供给警方是最有效的平衡搜素区域大小和精确度的方法。

8概要

在本文中我们设计了一个电子模型来预测犯罪以及根据已经发生的犯罪案件的时间和地点来估算下一次犯罪发生地点。

模型基于地理图形和大量使用靠近犯罪地点的公路系统。

为了保证模型的正确性,模型必须在已知犯罪地点的情况下运用。

例如,使用尸体发现地点而不是凶杀案地点将大大降低模型的预测能力。

第二,模型更适合应用于较小的区域,例如一个村庄或者一个小的城市。

模型把本地公路系统作为重点因素考虑,因此主要的适用于罪犯被怀疑使用汽车作为交通工具的案例。

模型做了两个预测。

第一,它给出未来的罪行将会发生的地点。

估计基于过去已经发生的犯罪,把重点在最近几起案件上面并把当地的公路系统考虑进来。

模型不能对罪犯将会在某一特定区域内的绝对概率给出准确的估计,但是能够计算出热点的位置来供执法部门参考调查。

通过通常路径和慢慢渐变的色彩,警方能够围绕热点来逐步扩大搜索区域来提高调查效果。

第二,模型基于rossmo模型进行估算。

这种方法平衡了距离对一个罪犯作案的影响。

第一个因素反映了罪犯花费很大的精力用在选择距离居住地很远的地方作案,而第二个因素反映的则是在罪犯住所附近实施犯罪的风险问题。

与先前的模型一样,方法计算出供执法部门参考展开调查以及确定展开调查的区域大小的热点。

通过对高调刑事案件的验证表明,模型中的两种方法都能够为警方的调查提供有效的出发点。

建议警方在应用我们的技术解决其他问题的时候适当的补充合适的处理措施。

 

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 高中教育 > 初中教育

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1