数据挖掘和数据碰撞的区别

一、什么是数据碰撞

数据碰撞是为了解决案件侦查中的某个问题或者查找案件线索,如犯罪行为人的活动轨迹、身份信息、涉案物品的确定等。

数据碰撞技术。具体而言,就是通过专门的计算机软件对两个或两个以上的数据库/数据集进行碰撞比对,并对由此产生的重合数据、交叉数据进行深度分析

大数据侦查中,数据碰撞一般遵循以下步骤。

第一步,确定查找对象。数据碰撞是为了解决案件侦破中的某个问题或查找线索,如嫌疑人的行为轨迹、身份信息、同行人员的查找、涉案物品的确定等。

第二步,根据查找对象确定并筛选相关数据集。一个案件中涉及的数据集很多,但并非每个数据集都有必要作为碰撞的对象,而是根据分析主题的需要确定一定时空范围的相关数据集。例如根据已知的行为人运动轨迹,就可以沿途重要地点为坐标调取手机基站数据。

第三步,对选取的数据集之间进行碰撞比对。一般需要两个或两个以上的数据集,进行两两碰撞或多个数据集同时碰撞,匹配出的交叉数据便是可疑目标数据,本文也称之为“节点数据”,它们往往能够说明数据之间的关联性或者同一性。

第四步,根据具体案情进一步对节点数据进行分析研判,获取更多的线索、确立下一步侦查方向。

二、数据碰撞的原理

数据碰撞是为了解决案件侦查中的某个问题或者查找案件线索,如犯罪行为人 的活动轨迹、身份信息、涉案物品的确定等。其次,根据查找对象确定并筛选相关数据集。一个案件涉及多个数据集,但并非每个数据集都有必要作为碰撞的对象,而是根据分析主题的需要确定一定时空范围的相关数据集。如根据已知犯罪行为人活动轨迹,可以以沿途重要地点为坐标调取手机通讯机站数据。再次,在选取的数据集之间进行碰撞比对。一般需要两个或者两个以上的数据集,进行两两碰撞或者多个数据集同时碰 撞,匹配出的交叉数据集便是可疑目标数据,即 “节点数据”,它们常常能够说明数据之间的关联性或者同一性。最后,根据具体案件进一步对节点数据进行分析研判,获取更多有价值的线 索,确定侦查方向或者采取的侦查方法。

二、数据碰撞的注意点

需要注意以下一些要点及技巧:

数据碰撞以全面的“数据化”为基础,嫌疑人的行为、轨迹、身份信息等数据被记录、存储下来是数据碰撞的前提。这既依托侦查机关本身的信息化建设,也依赖于全社会的大数据、物联网的发展进程。

②用以碰撞的数据集与数据集之间必须是同类数据,例如两个同是车牌号的数据集可以进行碰撞,但是车牌号数据集与姓名数据集之间就无法进行碰撞。

③用以碰撞的数据往往是带有识别性的数据符号,这也称之为“标识数据”,如身份证号、姓名、手机号、账号、车牌号、手机串号等数字,这些数据具有唯一性特征,能够直接指向对应的人或物。一般以标识数据为媒介来进行碰撞,更容易快速、精确获取目标信息。例如在逃人员数据与全国基本人口信息数据库碰撞可以身份证号为标识数据,基站数据库之间的碰撞可以手机号为标识数据。

④数据碰撞中,在所知案件信息有限的情况下,需要以“时空数据”作为限制条件。时空数据是描述事件、行为的时间、地理信息的数据,一般用作筛选数据集的依据,以提高数据碰撞的准确性。碰撞中所运用的时空数据越多,碰撞的结果就越精准。例如事先知道嫌疑人的轨迹,想找到其伴随车辆的车牌号等信息,这时便可以调取嫌疑人行动轨迹上的各卡口车辆数据进行碰撞,如果不进行时空限制,调取每个卡口的车牌数据库进行碰撞,很可能会出现大量的重合数据,但如果结合嫌疑人在每个卡口的时空数据,选取每个卡口对应时间段的车辆数据进行碰撞,满足条件的车牌号就会大大精减。

转自:https://www.jianshu.com/p/956e601b7229

猜你喜欢

转载自blog.csdn.net/fuhanghang/article/details/130699504