主页 > 商户

当前火热的公安大数据之浅见

时间:2019-08-15 来源:嘉怡时尚


点击上方蓝色字关注我们~











      笔者长期参与公安信息化建设与应用工作,见证了计算机技术在公安工作中不断深入应用的发展历程。从单机版户籍系统到各警种上下互通专业系统,从计算机单机运行到全国互联的公安信息专网,从信息采集到以系统集成、数据共享为目标的“拆墙”行动,公安机关计算机应用水平得到了飞速提升。随着互联网技术的发展,迎来了公安大数据时代,在不同的场合总听到“物联网”、“Hadoop”、“云存储”、“Spark”、“互联网+公安”之类的新词。在全国公安大数据应用风生水起、如火如荼的大背景下,冷静地谈一谈对当前公安大数据现状的粗浅认识,希望能作抛砖引玉之用。


1
 大数据基本定义

公安大数据面向刑侦、情报、反恐、科信等部门用户,以视频图像结构化数据为基础,整合公安自身业务数据、社会数据资源,分析挖掘数据价值,以人、事、地、物、组织为五要素进行数据建模,实现数据整合、信息共享、数据研判于一体。


今年初,据伙伴产业研究院(PAISI)研究统计,2017年全年数据总量将超过15.2ZB,同比增长35.7%。到2018年全球数据总量将达19.4ZB,未来几年全球数据的增长速度在每年25%以上。



什么是“大数据”?不同领域、不同行业和不同专家的认识和理解不尽相同。“百度百科”,指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。

2
 公安大数据的发展概况

总体来看,计算机技术在公安工作的应用分为三个阶段:

(一)探索起步阶段


20世纪80年代末到90年代末,沿海一些地方将计算机技术应用到公安工作中,率先提出了“科技强警”口号。探索开展110报警服务、刑事犯罪情报资料管理等零散的计算机应用。



(二)全面建设阶段


20世纪90年代末到2006年前后,公安信息化进入全面建设阶段。1998年,国务院决定建设“金盾工程”,即公安通信网络与计算机信息系统建设工程(后称全国公安工作信息化工程)。2003年,“金盾工程”一期正式启动,全面开展公安宽带网络、基础信息资源库和业务应用系统建设,至2005年底,一期建设任务基本完成,公安部与各省、市、县公安机关之间的三级公安专网全面建成,80%的基层所队接入公安专网。


(三)融合与共享阶段


从2007年开始,随着网络带宽不断提高,各类公安应用快速发展壮大,全国部署推进了“金盾工程”二期建设。在此基础上,各地在“拆墙行动”中通过业务集成、数据共享等手段实现了系统充分对接、业务充分融合、数据充分共享。



3
 对公安大数据的几点浅见
(一)公安大数据不“大”


“大数据”具备四个特征,可以概括为“4V”:即数量(Volume)、速度(Velocity)、多样(Variety)和价值(Value)。数量(Volume)指大数据的容量和规模远远超过传统数据;速度(Velocity)指数据产生的速度极快并要对其进行快速处理;多样(Variety)指数据的类型多,包括不同结构、不同来源、不同存储形式的各种数据;价值(Value)指大数据蕴含着重要的经济价值和社会价值。



(二)公安大数据重在挖掘


以需求为导向、以问题为导向、以应用为导向。数据大汇集工作仅仅是公安大数据工程中很小的一部分,公安大数据的重心应该着力在数据挖掘上,不断挖掘数据之间的关联性。基于大数据分析技术,实现对海量数据的深度挖掘和应用,通过统计、数学、深度学习等技术把数据分类、聚类、关联、预测,可以管理海量数据中隐藏的数据,对隐藏在数据中难以被发现的内在规则进行梳理,并从中提取潜在的有价值的信息。


(三)公安大数据不是公安大采集


在计算机技术应用到公安工作的发展历程中,基层民警总感到无比的痛楚,因为每一次技术变革,都给基层民警带来的是工作量的增加。纸质记录录进电脑,在不同的警种条线系统中录入重复的数据。所以,应着眼于公安工作业务,将业务流转化为数据流。另外,要将信息采集的源头重点放在政企业务系统和互联网公司,实现数据大汇集和大关联。


(四)公安大数据需要“大前台”


公安大数据的实质就是大应用。我一直认为公安大数据不是炒大锅菜,大数据的分析是建立在熟悉警种业务、摸清某类人行动规律、掌握某类人活动特点的基础上的具有警种特质的分析。简单的信息组合查询在之前“八大库”时代能够起到很好的效果,但是在数据量骤增、数据时空变换的公安大数据时代下,没有大前台作支撑,会把基层民警淹没在公安大数据的海洋中。所以,必须在实战中不断完善大前台;必须在实战中允许前台警种个性化、数据本地化。通过全方面的体系架构,实现从数据汇聚、数据清洗、存储、计算,到数据的碰撞、分析、研判、挖掘,最后到业务应用,形成一体化的统一、高效、便捷的大数据平台。



(五)公安大数据更需要“大后台”


如果按投入比例划分大数据前台操作展示和后台管理维护,笔者认为应该二八分,即应该花费80%投入到“大后台”建设与维护中。数据结构化、数据清洗、数据入库、数据标识、数据强关联与弱关联、用户操作记录分析与报警等等功能都应该在后台建设与维护中不断完善,一个“大前台”必须要有一个“大后台”作支撑。



(六)深刻理解公安大数据的“大”


在“大数据”相关的理论中有个“1秒定律”,意思就是说,对于海量数据进行挖掘分析要尽可能达到秒级响应,这主要也是一个人能容忍的操作等待时间,目前公安民警对系统响应的容忍度一般为3-15秒。不要一味的只求数据增量和总量,如果仅仅是重复数据或相似数据太多就会影响实际工作效率,增加生产成本(包括设备投入和时间成本)。所以,应该把注意力放在“人、车、电、网、像”方面还差哪些数据类型,补齐短板才是良策。