客服热线
400-655-2828
我是一个博亚的安防系统设计者,我的工作性质决定我经常出差到全国各地。有一天,我为了不延误航班而匆匆忙忙下了出租车,而把行李落在车里了。
这个时候你会怎么办?是沮丧的认命还是慌慌张张找交通台发布悬赏通告?
而我,作为一个安防系统的设计者,这一切并不能为我带来困难。
我只需要打电话给122,告诉我乘车的大概时间点和几个经过的区域,并没有让我等多长时间,我乘坐的出租车司机电话就发到我的手机上了。通过电话联系,司机很积极的把行李帮我送回了。
这是一个真实的案例,也是我的亲身经历。
而这一切是如何实现的呢?就由我一步步为大家来进行分析。在这里首先需要做的是信息采集。而信息的采集主要依托于三个方面。
平安城市建设是从2004年开始的,在公安部的统一领导下,各地为维护社会公共安全,预防打击违法犯罪活动,公安机关开展了城市报警与监控系统的建设。公安机关以重点单位要害部位和公共场所为主要建设的对象,分期开展了477个城市试点单位工作。平安城市建设到了2013年,公安机关指导下社会单位安装的摄像机也超过了1000余万台,其中公安机关建设的300余万台,成为世界最大的视频图象信息的传感网。
传统的视频监控的图像因为是非结构化信息,画面中包含的信息量庞杂、冗余,并不能被计算机直接应用。而这次事件中,要达到快速反应,则是依赖于最新的城市治安卡口系统,它能够把所有经过的车辆图像进行结构化分析,提取其中的车牌、车型、时间、地点等信息。使计算机能够直接用于计算、对比。
金盾工程是“全国公安信息化工程”的简称,其实质是:应用现代信息和网络技术,达到全国公安机关信息资源的高度共享与综合利用,实现“统一指挥、快速反应、协同作战”的目标。
金盾工程的总体目标是:落实“体育强警”战略决策,在现有的公安信息化基础设施和装备的基础上,充分利用先进的技术手段建成和不断完善全国公安通信网络和全国公安信息系统,推动公安各业务系统的应用,实现公安工作信息化。
金盾工程的一期工程目标是:完成《“金盾工程”项目(一期工程中央投资部分)初步设计》确定的建设内容和投资计划。到2005年底,在全国公安机关初步建成一个信息化基础比较完备,信息应用种类比较齐全,部分公安业务工作在全国范围内实现信息化工程流程,基本满足公安工作信息化框架体系。
金盾工程的二期建设目标是:
1. 基本构建起公安大情报系统,基本解决目前信息化发展不平衡的问题,全面提高公安信息化的整体应用水平;
2. 网络、安全等信息化基础设施进一步完善,基础所队接入网全面普及;
3. 80%以上的公安业务工作信息在采集、使用、维护上实现信息化流程;
4. 全国人口基本信息等八大资源库的数据质量全面达到完整、准确、鲜活的要求;
5. 社会信息资源的共享利用进一步拓展和充实,公安情报信息系统等高端应用得到推广,公安信息资源综合开发利用的水平明显提高;
6. 全警采集、全警应用、全景共享的公安信息化应用格局基本形成,在应用信息化加强公安队伍建设及公安机关内部管理上实现新的突破。
其中八大信息资源库建设属于金盾工程一期建设的主要任务之一,基本内容是在各地区、各部门、各警种相关信息系统建设的基础上,在公安部信息中心建立“全国人口基本信息资源库”等八大基础性、共享性信息资源库。八大公安信息资源库包括:全国人口基本信息资源库、全国在逃人员信息资源库、全国违法犯罪人员信息资源库、全国出入境人员信息资源库、全国被盗抢汽车信息资源库、全国警员基本信息资源库、全国安全重点单位信息资源库、全国机动车 / 驾驶员信息资源库。
大数据到底是什么呢?最早提出大数据时代到来的是麦肯锡:“数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来。”
而在IT业界(IBM最早定义)将大数据的特征归纳为4个“V”(量Volume,多样Variety,价值Value,速Velocity),或者说特点有四个层面:
第一,数据体量巨大。大数据的起始计量单位至少是P(1000个T)、E(100万个T)或Z(10亿个T);
第二,数据类型繁多。比如,网络日志、视频、图片、地理位置信息等等。
第三,价值密度低,商业价值高。
第四,处理速度快。最后这一点也是和传统的数据挖掘技术有着本质的不同。
让我们来还原一下,这三方面是如何在本次事件中发挥效力的。
我在报案后,警方把我反应的关键信息输入到视频监控平台,通过治安卡口的视频结构化数据和GIS系统的结合,在GIS地图上模拟出我的行为轨迹。警方通过我的轨迹和整个城市交通运行系统中记录的车辆轨迹进行碰撞,发现我的轨迹和某些车辆的轨迹有重叠。那么我乘坐的出租车肯定就包含在这些车辆中。
再通过金盾系统的车辆库查询,找出这些车辆中的出租车,以及出租车所关联的驾驶员信息,最终找到我乘坐的出租车。
我们可以看出,轨迹是本次案件分析的重点。那么“轨迹”蕴含了什么信息?
其实“轨迹”信息可分为两类:
关系型轨迹:轨迹表示的是一个人和他所有社会联系人之间的连线,它具有一个人明显的社会特征。是一个有限集合,有明显的“原点”(我)和收敛的“停驻点”(我的社会联系人)。具有一定的规律和重复性。活动频率一般偏低。
运输类轨迹:轨迹表现了某种城市行为的特征,如出租车送客,货车送货等。不同“工具”因为获利环境不同,从而具备不同的运输轨迹特征。活动频率高,像出租车等都有持续活动的特点。可用来评价一个城市不同功能区间的有效性。
而大数据是通过“轨迹”解决问题的基础。因为开车人到目的地都是有意识的,不存在持久的,无意识,漫无目的的轨迹。从信息原理来看,要把开车人社会角色分开,只要采集的特征信息类型足够就能做到,特征信息来源有两类:
1. 直接增加外部的数据源,这种方式确定的数据模型会更实时;
2. 现有数据源中,利用统计等方式计算得到过程特征信息,这种方式首先要累计足够的历史信息。
大数据解决问题的基础是通过方式二来增加数据特征类型,如能增加外部数据类型,则描述的角色模型会更准确,判断会更实时。
其实轨迹的大数据分析,也可以实现很多犯罪研判工作,找出某些犯罪的可能性,比如:
突然活动规律发生突变,且忽然晚上运行,目的是城外 – 存在被盗抢可能。
持续活动,在某些区域出入的频率特别异常 – “黑车”嫌疑 。
持续活动,但轨迹频繁有异常 ,在同一个时间段,同时出现不同的地点 — 套牌出租车,通过GPS信息,可直接定位谁是“李鬼”。
有预谋犯罪:主体一般是“有犯罪前科的人”,他们有明显的娱乐和社交特点,犯罪前会有所准备,会踩点 — 这是“积分模型”的真正意义,定义并累积城市的异常社会交往过程,从而发现犯罪的蛛丝马迹
我们在这里举个例子:抓黑车(也就是非法营运的私家车)。
我们通过数据模型知道,不同运输对象获利方式不一样,所以具有不同的统计特征,出租车和黑车都具有轨迹长期持续的特点,但黑车需频繁出入某些特定区域来拉客源。通过对轨迹持久性分析,我们可以对以下数据模型进行分析统计:
通过下面表格数据模型的分析,我们能够得出城市中有30万辆车,其中1万辆出租车,1000辆非法运营的车,3000辆送货车,其中2000辆用户自家送货,1000辆为快递送货车辆。
这个数据的分析是依赖于城市中所有车辆在1年内的行驶记录来形成的,整个数据体量达到了上百亿条。在这上百亿条数据中进行如此大体量的快速分析,只有大数据技术能够实现。而云计算技术是支撑大数据运算的根本。所以大数据常和云计算联系到一起。实时的大型数据集分析需要依赖于云计算的分布式处理框架来向数十、数百或甚至数万的电脑分配工作。
云计算的分布式处理系统是可以将不同地点的或具有不同功能的或拥有不同数据的多台计算机用通信网络连接起来,在控制系统的统一管理控制下,协调地完成信息处理任务—这就是分布式处理系统的定义。
云计算思想的起源是麦卡锡在上世纪60 年代提出的:把计算能力作为一种像水和电一样的公用事业提供给用户。 如今,在Google、Amazon、Facebook等一批互联网企业引领下,一种行之有效的模式出现了:云计算提供基础架构平台,大数据应用运行在这个平台上。
IT 业内是这么形容云计算和大数据之间的关系:没有大数据的信息积淀,则云计算的计算能力再强大,也难以找到用武之地;没有云计算的处理能力,则大数据的信息积淀再丰富,也终究只是镜花水月。
在最近结束的《2014 第四届中国智慧城市大会》中,中国工程院院士、中国物联网行业的领军人物邬贺铨介绍到:“城市的数据是智慧城市的重要资产,而政府是数据的最大拥有者,也将是最大的受益者”。
现在通过平安城市的视频监控系统和金盾工程的建设,公安系统已经成为政府中最大的数据拥有者。而成为实现最大受益者的重担义无反顾的压在公安系统的身上。要实现数据的最大收益,基于云计算的大数据分析是最佳的实现方式。通过大数据技术对城市治安系统的数据分析,可以让城市治安得到根本性解决,也许某一天真的能够实现《少数派报告》中所演绎的场景,让所有的犯罪终止于犯罪之前。