a&s专业的自动化&安全生态服务平台
公众号
安全自动化

安全自动化

安防知识网

安防知识网

手机站
手机站

手机站

大安防供需平台
大安防供需平台

大安防供需平台

资讯频道横幅A1
首页 > 资讯 > 正文

基于数据挖掘的上海市违法案件热点分布及其影响因子分析

在空间数据挖掘领域中,热点分析可以用于识别具有统计显著性的高值(热点)和低值(冷点)的空间聚类,得到高值或低值要素在空间发生聚类的位置。本文利用ARCGIS9.1中的热点分析工具,分析了上海2009年的几个侵犯财产类的违法案件数据,找到了违法案件在不同时间的高发位置。通过空间数据挖掘,为情报、指挥和实战部门决策提供参考和防范依据。
资讯频道文章B

  在空间数据挖掘领域中,热点分析可以用于识别具有统计显著性的高值(热点)和低值(冷点)的空间聚类,得到高值或低值要素在空间发生聚类的位置。本文利用ARCGIS9.1中的热点分析工具,分析了上海2009年的几个侵犯财产类的违法案件数据,找到了违法案件在不同时间的高发位置。通过空间数据挖掘,为情报、指挥和实战部门决策提供参考和防范依据。

  当前在公安部门被广泛采用的仍然是人工分析的手段,这种人工分析的方法往往面临很大的挑战,例如分析的数据和信息通常分布在许多不同的数据源,信息量大且缺少关联性;并且人工分析手段通常被看作是一种特殊的专业技能,很难在一个大的组织中进行经验的共享和传递,因而存在一定的局限性。

  从国内外与数据挖掘相关的研究领域中,我们发现,采用可视化技术可将不同类型的数据和数据间隐含的关联信息进行描述和展现,并借助众多空间数据挖掘的方法来发现和揭示数据中隐含的公共要素和关联,且已成为该领域研究所采用的手段和方法的发展趋势。

  城市违法案件在一定的地域环境下,并不是随机分布的,而是与该地区的人口、环境、经济、政策、社会因素有着必然的联系,并表现出一定的时间和空间形态。掌握违法案件的时空分布规律, 对有效打击违法案件、提高民众对社会安全信赖程度起着非常重要的作用。在众多的空间数据挖掘方法中,热点分析是理解事件间隐含关系的有效工具,通过热点分析的数据挖掘可以有效地对事件做出回归分析和前景预测,因此将违法案件治理、预防与热点分析结合起来将更好地帮助研究人员得出科学的结论。

  在空间数据挖掘领域里,学者们就热点分析所做的研究工作大致可分为如下几类:划分技术、网格技术、密度技术、层次聚类技术以及空间自相关。这些方法各有特点,但空间自相关不仅能够探测热点,还能够揭示事件间的联系,所以本研究中采用自相关分析方法。

  本文采用上海2009年盗窃、抢劫违法案件数据进行处理和热点分析,并选取了常住人口密度、来沪人口密度等可能影响违法案件发生的18个指标进行了主成分分析,探索隐含的空间关联模式。有助于打破以往被动预防违法案件的局面,主动对重点区域、重点指标加强管理,为城市预防违法案件措施在空间上的合理布局提供决策导向和参考。

  研究区域与方法

  研究区域与数据

  研究范围

  研究区域上海,地处长江三角洲前缘,面积约为6340平方公里,1900多万常住人口,是中国经济、金融、贸易和航运中心,共19个 区县,包含“中心城核心区”包括黄浦、静安、卢湾、虹口;“中心城边缘区”包括杨浦、闸北、普陀、徐汇、长宁;“近郊区”包括青浦、松江、嘉定、闵行、宝山、浦东;“远郊区”包括金山、奉贤、崇明。我们数据处理和统计的单元为派出所辖区,共有441个。

  数据来源与处理

  空间数据包括行政区、派出所范围。案件数据根据研究需要重点抽取了2009年抢劫、扒窃数据,并按照派出所进行统计。人口、房屋数据包含户籍人口、外来流动人口、境外人口、出租房、闲置房、自住房、集体宿舍、工地工棚,以及娱乐休闲等场所数据,上述数据通过ETL工具,根据研究需要进行抽取,并进行了预处理。

  研究方法

  热点分析Hotspot analysis

  本次研究采用了ARCGIS9.1的热点分析工具,热点分析工具为数据集中的每一个要素计算 Getis-Ord Gi* ,得到高值或低值要素在空间发生聚类的位置。

  Getis-Ord局部统计可表示为:

  其中xj是要素j的属性值,wi,j是要素i和j之间的空间权重,n为要素总数,且:

  主成分分析

  主成分分析 ( Principal Component Analysis , PCA )是一种掌握事物主要矛盾的统计分析方法,它可以从多元事物中解析出主要影响因素,揭示事物的本质,简化复杂的问题。

  本次研究中,我们把盗窃、抢劫案件1到12月份热点区域常住人口密度、来沪人口密度、境外人口密度、出租房数、闲置房数、自住房数、集体宿舍数、工地工棚数、旅店数、娱乐休闲场所数、歌舞厅数、网吧数、桑拿洗浴场所数、游艺游戏机房数、台球厅数、酒吧数、咖啡吧数、茶室数量等18个指标,利用SPSS进行了主成分分析。

  结果与讨论

  违法案件热点的时空分布

  计算结果得出了盗窃、抢劫案件每个派出所的Z、P值,当P值<0.05时,形成的Z值有两个区间,即Z>2.58,Z<-2.58,说明两类案件都具有明显的空间聚集,即具有热点和冷点。图1,图2分别是上海市盗窃案件和抢劫案件的热点、冷点时空分布图,图中深红色表示案件的热点区域,深蓝色表示是案件的冷点区域。

  图1显示盗窃案件违法案件热点主要以“中心城核心区”为中心,随季节变化而动态变化,前三季度主要向东西方向延伸,而第四季度向南北方向延伸,而远郊区基本是违法案件冷点。图2显示,抢劫案件违法案件热点主要集中在中心城边缘区和近郊区,而中心城核心区在大多数季节是违法案件冷点。

  违法案件热点相关因素的主成分分析

  分析结果显示同类案件不同时间的主成分分析结果基本一致。而盗窃案件和抢劫案件的分析结果还是有较大的差别。

表1

表2

  表1,表2是2009年9月上海盗窃案件的主成分分析结果,表2剔除了累计贡献率大于85%以后的成分。

表3

表4

  表3、表4是2009年9月上海抢劫案件的主成分分析结果,表4中剔除了累计贡献率大于85%以后的成分。

  根据分析结果和实际调查,影响盗窃案件的主要因素是娱乐休闲场所、歌舞厅、游艺游戏机房、桑拿洗浴场所,而影响抢劫案件的主要因素是来沪流动人员密度和出租房屋数量。

  结论

  我们通过对上海2009年1月~12月的盗窃、抢劫数据进行空间数据挖掘,发现了上海盗窃、抢劫违法案件的整体态势和空间上的动态变化趋势,并通过主成分分析,解析出了影响盗窃、抢劫违法案件热点的主要影响因素。

  所以,我们建议在市中心区域加强娱乐休闲场所、歌舞厅、游艺游戏机房、桑拿洗浴场所等的管理,而在近郊地区加强来沪人员和出租房屋的管理,并加强巡逻。

参与评论
回复:
0/300
文明上网理性发言,评论区仅供其表达个人看法,并不表明a&s观点。
0
关于我们

a&s是国际知名展览公司——德国法兰克福展览集团旗下专业的自动化&安全生态服务平台,为智慧安防、智慧生活、智能交通、智能建筑、IT通讯&网络等从业者提供市场分析、技术资讯、方案评估、行业预测等,为读者搭建专业的行业交流平台。

免责声明:本站所使用的字体和图片文字等素材部分来源于互联网共享平台。如使用任何字体和图片文字有冒犯其版权所有方的,皆为无意。如您是字体厂商、图片文字厂商等版权方,且不允许本站使用您的字体和图片文字等素材,请联系我们,本站核实后将立即删除!任何版权方从未通知联系本站管理者停止使用,并索要赔偿或上诉法院的,均视为新型网络碰瓷及敲诈勒索,将不予任何的法律和经济赔偿!敬请谅解!
© 2024 - 2030 Messe Frankfurt (Shenzhen) Co., Ltd, All rights reserved.
法兰克福展览(深圳)有限公司版权所有 粤ICP备12072668号 粤公网安备 44030402000264号
用户
反馈