数据挖掘和犯罪情报

时间:2019-04-03 22:30:42 阅读:22次

  即使Philip K. Dick的“Precrime”尚未成为现实,今天的数据挖掘和犯罪情报预防技术正在彻底改变犯罪行为,帮助地方和国家执法机构更好地预防和起诉犯罪。

   2001年9月11日的恐怖主义行为改变了我们的世界。从那时起,所有西方国家的国土安全问题急剧增加。结果,执法机构和地方当局开始收集大量信息和数据,以防止未来的袭击。

  美国可能是该领域最活跃的国家,甚至在911之前。作为最早的实验性犯罪数据库之一,Coplink项目由亚利桑那大学人工智能实验室和图森警察局创建,并由国家司法部于1997年资助。

   Coplink展示了如何利用数据挖掘和犯罪情报技术,通过在不同执法机构之间共享信息并使用分析工具收集信息,大幅提高犯罪预防活动的效率和起诉犯罪分子。

  例如,它展示了数据挖掘如何成为一种强大的工具,帮助调查人员和犯罪分析师在几秒钟内检查大型数据库,提供预防犯罪所需的信息和洞察力,快速且错误更少。

数据挖掘和犯罪情报技术

   Coplink项目试验了各种最常用的数据挖掘和犯罪情报技术,包括以下

  实体提取:通常用于自动识别非结构化数据(如警方报告)中的人员,组织,车辆和个人详细信息。即使实体提取仅提供基本信息,它也可以通过从大量非结构化数据中快速提供精确的详细信息来加速调查。

  聚类技术:聚类技术用于在类中将相似的特征组合在一起,以通过最大化或最小化相似性来获得智能;例如,识别以类似方式犯罪的嫌疑人或犯罪集团。通过概念空间算法可以有效地应用聚类技术,通过交叉引用犯罪记录中的实体来发现犯罪关系。

  关联规则:此数据挖掘技术已用于发现数据库中的重复项目,以便创建模式规则并检测潜在的未来事件。此技术可有效防止网络入侵和攻击,例如拒绝服务攻击(DDoS)。

  顺序模式挖掘:作为关联规则,在网络安全性中识别序列或重复项以便定义模式和防止攻击是有用的。

  分类:此技术可用于分析非结构化数据,以发现犯罪实体之间的共同属性。分类与推理统计技术一起用于预测犯罪趋势。这种技术可以大大缩小不同的犯罪实体,并将它们组织成预定义的类。

  字符串比较:此技术用于通过比较结构化文本字段来揭示犯罪记录中的欺骗性信息。这需要高度密集的计算能力。

文本挖掘和犯罪情报

  由于许多警察记录系统包含大量非结构化数据,因此文本挖掘技术是数据挖掘和犯罪情报技术发展的下一步。专家系统的Cogito智能平台是语言分析工具的一个很好的例子,可以应用于犯罪知识领域,对大型非结构化数据集进行更智能,可操作的分析,以防止犯罪。

数据挖掘和犯罪情报所属专题:数据挖掘专题 挖掘专题 《数据挖掘和犯罪情报》链接:http://www.zhouchuanxiong.net/1638