Spark芝加哥犯罪数据分析与可视化

1、明确分析目标:多年来犯罪如何变化?是否有可能预测犯罪将在何时何地发生?在这段时间内,这个城市的哪些地区已经发生了变化?

2、针对以上目标,主要根据:犯罪时间 Date、犯罪类型 Primary Type 、逮捕情况 Arrest、犯罪地点 location_description(所属社区 community_area )等几列数据进行分析。

3、具体分析内容有:

  • 近年来犯罪变化情况:每年的犯罪记录统计
  • 犯罪频次最高的时段(几月,几点):按一年各月对比犯罪发生情况,按一日各小时统计犯罪发生情况
  • 犯罪较多的类型:各类犯罪的总数对比,主要犯罪类型的每年变化情况
  • 不同时段中频次最高的犯罪类型:按时段对不同犯罪类型做比较
  • 哪些犯罪类型不易抓捕(危险类型):对比各类犯罪的逮捕情况
  • 犯罪频次较高的犯罪地点:犯罪地点统计,犯罪社区统计
  • 各地区的犯罪变化情况:各区每年总犯罪情况统计
  • 犯罪地点与犯罪时间的关系:不同时间段犯罪频次最高地点,以及不同地点发生犯罪案件最多的时间段
  • 各地区的犯罪变化情况:各区每年总犯罪情况统计

4、根据以上对数据的分析,可以得出关于芝加哥近年犯罪率的变化情况,以及各社区的安全系数,哪个时间段犯罪率较高,从而进一步分析,不同警区的逮捕犯罪情况,以及该警区管辖的社区犯罪频次,各地区的犯罪发生次数的增减与被捕情况的关系,等。

猜你喜欢

转载自www.cnblogs.com/colorfulday/p/10856051.html