智慧安防顶层设计规划_智慧顶层规划设计
智慧安防顶层设计规划由刀豆文库小编整理,希望给你工作、学习、生活带来方便,猜你可能喜欢“智慧顶层规划设计”。
第1章 智慧安防顶层设计规划
1.1 顶层设计说明
1.1.1 设计依据说明
我们根据都昌县智慧安防项目建设的实际需求与具体条件,充分发挥自身的产品与技术优势,提出目前阶段系统的建设方案,参考了公安局相关文件和中华人民共和国相关条例和规范,包括:
《城监控报警联网系统技术标准》(GA/T669-2008) 《城监控报警联网系统系列标准》(GA/T669-2008) 《中华人民共和国公安部行业标准》(GA70-94) 《视频安防监控系统技术要求》(GA/T367-2001) 《民用闭路监视电视系统工程技术规范》(GB50198-94) 《工业电视系统工程设计规范》(GBJ115-87) 《安全防范系统通用图形符号》(GA/T75-2000)
《道路交通安全违法行为图像取证技术规范》(GA/T 832—2009) 《机动车号牌图像自动识别技术规范》(GA/833-2009) 《闯红灯自动记录系统通用技术条件》GA/T496-2009 《建筑及建筑群综合布线工程设计规范》(GB/T50311-2000) 公安部《警用地理信息系统系列标准规范》 《电视视频通道测试方法》(GB3659-83)
《彩色电视图像质量主观评价方法》(GB7401-1987) 《信息技术开放系统互连网络层安全协议》(GB/T 17963) 《计算机信息系统安全》(GA 216.1-1999) 《安全防范工程程序与要求》(GA/T75-94) 《安全防范工程技术规范》(GB 50348-2004) 《建筑物电子信息系统防雷技术规范》(GB50343-2004) 《安全防范系统雷电浪涌防护技术要求》(GA/T670-2006) 《民用建筑电气设计规范》(JGJ/T16-92) 《公安交通电视监视系统验收规范》(GA/T509) 《安全防范系统验收规则》(GA308/2001)
《中国电气装置安装工程施工及验收规范》(GBJ232-90.92) 《建筑与建筑群综合布线系统工程验收规范》(GB/T50312-2000) 《安全防范系统验收规则》GA308-2001 《安全防范工程费用预算编制办法》GA/T70-2004 《报警传输系统串行数据接口的信息格式和协议》GA/T379.1~379.10-2002 《视频安防监控系统 变速球型摄像机》GA/T645–2006 《视频安防监控系统 矩阵切换设备通用技术要求》GA/T646–2006 《视频安防监控系统 前端设备控制协议V1.0》GA/T647–2006 《社会治安动态监控系统通用技术要求》GA/T669–2006 《安全防范系统雷电浪涌防护技术要求》GA/T670–2006 《防盗报警中心控制台》GB/T16572-1996 《报警图像信号有线传输装置》GB/T16677-1996 《民用闭路电视系统工程技术规范》GB50198-94 《计算机软件开发规范》GB8566-88 《电子计算机机房设计规范》GB50174-93 《中国电气装置安装工程施工及验收规范》GBJ232-90.92 《建筑物防雷设计规范》GB50057-94 《以太网10BASE-T标准》IEEE802.3 《安防系统工程质量检验实施细则(试行稿)》
《用电通信网光纤数据传输系统工程施工及验收暂行技术规范》 《公安交通指挥中心建设与发展的若干意见》 《公安计算机信息系统九五规划》
《道路交通科技发展九五计划和2010年规划》 《交通管理信息系统建设框架》 《1:500、1:1000、1:2000地形图数字规范》(GB/T17160-1997) 《地球空间数据交换格式》(GB/T17798-1999)
《计算机信息系统安全保护等级划分准则》(GB17859-1999) 《信息技术包过滤网闸安全技术要求》(GB/T18019-1999) 《民用闭路监控电视系统工程技术规范》(GB50198-1994)
《计算机信息系统安全等级保护管理要求》(GAT388-2002B) 《城警用地理信息分类与代码》(GA/T491-2004) 《城警用地理信息系统建设规范》(GA/T493-2004) 《城警用地理信息数据分层几命名规则》(GA/T532-2005) 《城警用地理信息图形符号》(GA/T 492); 《城警用地理信息属性数据结构》(GA/T 529);
《城警用地理信息数据组织及数据库命名规则》(GA/T 530); 《城警用地理信息专题图与地图版式》(GA/T 531); 《城警用地理信息数据分层及命名规则》(GA/T 532) 《城地理空间框架数据标准》(CJJ103-2004)
《安全防盗报警设备安全要求和试验方法》(GB 16796); 《入侵报警系统技术要求》(GA/T 368);
《报警传输系统串行数据接口的信息格式与协议》(GA/T 379.1-10); 《有线电视系统工程技术规范》 GB50200 《公安交通电视监控系统验收规范》 GA/T509 《MPEG4视音频编解码标准-视听对象的编码(6部分)》 ISO/IEC14496-2 《计算机网络实时监控系统》 Q/SBK005-2001 《公路车辆智能检测自动记录系统》 GA/T497-2004 公安部公交管[1997]231号文件
《工业自动化仪表工程施工及验收规范》 GBJ93 《道路交通标志线》 GBJ5768 《建筑电气设计技术规范》 GBJ16 《中华人民共和国公共安全行业标准》 GA/75-94 《建筑与建筑群综合布线系统工程设计规范》 CESC89:97 《中华人民共和国道路交通安全法》 《中华人民共和国道路交通安全法实施条例》 《公路交通安全设施设计技术规范》 JTJ 074-2003 《闯红灯自动记录系统通用技术条件》 GA/T496-2004 《治安卡口系统通用技术条件》 GA/T497-2004 《民用闭路电视系统工程技术规范》 GB50198-94 《安防视频监控系统技术要求》 GA/T 367-2001 《中华人民共和国公共安全行业标准》 GA38-92 《中国电气装置安装工程施工及验收规范》 GBJ232-90.92 机动车、驾驶员及违法管理等相关数据库规范2004版 《道路交通标志和标线》GB5768 《安全防范系统验收规则》 GA 308-2001 《民用建筑电气设计规范》 JBJ/T16-92 《建筑及建筑群综合布线系统工程设计规范》 GB/T 50311-2000 《建筑及建筑群综合布线系统工程施工及验收规范》 GB/T 50312-2000 《屏蔽双绞线系统现场测试传输性能规范》 EIA/TIATSB67 《电气装置安装工程施工及验收规范》 GBJ120-88 《建筑物防雷设计规范》 GB50057 《闭路电视监控系统工程规范》 GB50198-94 《电视接收机确保与电缆分配系统兼容的技术要求》 GB12323 《10BASE-T,100BASE-TX标准》 IEEE802.3,IEEE802.3U 《中华人民共和国通信行业标准》 YD/T926 1.1.2 设计范围说明
都昌县智慧安防建设需要充分利用安防场近年来的最新、最可靠的科技成果,以便该系统在尽可能长的时间内与社会发展相适应,并使系统具有强大的发展潜力。在满足实际使用的基础上,不盲目追从新潮和“最先进”,采用的技术和设备,注重操作的便利性和人性化,确保使用方便、安全,并且经久耐用,为满足今后发展的需要,系统在使用的产品系统、容量及处理能力等方面具备兼容性强,可扩充与换代的特点,确保整个系统可以不断得到充实、完善、改进和提高。这样不仅充分保护了投资,而且具有较高的综合性能价格比。在设备的造型上,注重根据实际需要进行品牌和产品的搭配,确保每个应用环境所选用产品的最高性能价格比。
针对智慧安防建设的实际情况,智慧安防系统主要建设的范围有:(一)平安系统建设:从管理的全局需求出发,采用固定治安监控点与移动执法监控相结合、公安治安监控与社会治安监控相结合、视频监控与GIS系统相结合、人工监控与智能分析相结合、分布式管理与统一指挥管理相结合等方式,通过新建扩建、整合利用、升级改造和业务集成等途径,提高监控图像质量,扩大视频监控范围,整合现有各种视频资源,实现视频资源的共享和视频信息增值应用,最终建立全方位、立体化的多级监控联网管理体系。
(二)都昌县安全综合管理平台。用于治安监控系统、交通监控系统、家居安防系统及其它社会监控资源接入和管理,同时向公安、应急等部门提供图像信息和报警信息。
(三)应急系统。采取多种方式和途径,获取现场图像信息并及时上报,提供上级应急指挥平台所需的相关数据、图像、语音等资料。据此,CSST依托自身智慧城架构及专业技术优势,采用“平战结合”的设计思路,建立了面向各级别的应急管理的应急平台。
(四)治安监控系统。规划内所有治安关注点,提供7*24小时远程视频巡逻,实现“事前预警”和“事后取证”双重功能。
(五)联网报警系统。融合了“人防、物防、技防”的报警运营平台为核心,面向用户提供专业化服务。充分考虑国内通信网络情况,采用统一接警、统一管理、划分区域监控的多级部署模式。主要提供防盗、防抢、防火、求助及常驻警备服务。服务对象包括个人、社区家庭、机动车辆、商业结构、企业、金融机构、医疗机构、通信机构、文博单位等。
(六)安全生产防护系统。安全生产监管体系的建设主要针对重大、特大恶性事故的监管防范。本方案应用最新的现代通讯、多媒体、计算机、自动化控制等理论与技术,按照系统工程原理,以网络和信息系统为基础,以GIS平台支撑,以有、无线通信为纽带,以控制重大事故发生为目的,采取对重大危险源实施动态实时监控,切实确保应急救援有对象、有措施、有序、高效地开展各项现场救援活动,把事故损失控制在最低程度,防止重特大事故的发生,有效地减少事故损失和社会影响。
(七)指挥调度系统。规划搭建在综合管理平台上,为接处警和应急提供调度功能。
(八)三维地理信息系统。规划搭建在综合管理平台上,提供3D可视化操作及空间分析、辅助调度、辅助决策功能。
(九)智能机器人巡逻系统。智能机器人巡逻系统能够协助保安管理人员有效地完成区域安全保障工作,如商场、博物馆、住宅小区及其他公共场所可以实现自主环境探测、自主避障及自主充电功能,能够按照工作人员的具体要求在非人工干预的情况下自主完成固定路线巡逻、随机路线巡逻及重点部位察看任务。能够进行视觉及双向语音信息的远程传输与监控,可用作检测环境烟雾及火灾情况并进行异常情况报警。
1.2 智慧安防规划原则
为适应社会的发展,强化城区安全防范建设,加强城区治安防范力量,有效防范重大案件发生,在城区范围内设置全天候监控点,建立城区安防视频监控联网系统,实时了解城区路面、社区治安状态及交通状态,在全形成统一协调的动态视频指挥网络。
在设计整个系统时,我们本着技术先进、系统实用、结构合理、产品主流、低成本、低维护量作为出发点。
技术的先进性:整个系统选型、软硬件设备的配置均要符合高新技术的潮流,关键的视频数字化,压缩、解压、码流、传输均采用国内外工程建设中被广泛采用的技术与产品。在满足功能的前提下,系统设计具有先进性,并且在今后一段时间内保持一定的先进性。
架构合理:采用先进成熟的技术来架构各个子系统组成稳定可靠大系统,使其能安全平稳地运行,有效地消除各子系统可能产生的瓶颈,选用合适的设备来保证各子系统具有良好的扩展性。稳定性和安全性是我们最关心的问题,只有稳定可靠的系统才能确保各设备的正常运行;只有良好的数据共享,实时的故障修复,实时备份等才能形成完整的管理体系。
产品主流:在设备选型时,主要依据我的实际情况结合目前我国场上的占有率高的各类产品中选择具有最优性能价格比和扩充能力的产品。 低成本、低维护量:所设计的系统和采用的产品应该是简单、实用、易操作、易维护。系统的易操作和易维护是保证非计算机专业人员使用好本系统的条件。
集中管理:前端现场设备,各分系统集中于中心统一控制,实施对所有远端设备的控制、设置,以保证系统的高效、有序性。
扩展性强:所有设备都采用标准化可扩展模块,模块数量可以根据需要随意增加,而不影响系统中其他设备的正常使用。如需要更多图像,只需增加相应数量的模块即可。
1.3 智慧安防总体设计规划
都昌县智慧安防项目建设的远期目标是构建城综合预警系统和应急指挥体系。现实目标是建设一套及社会治安综合治理、城交通管理和消防调度指挥于一体的城警务综合管理系统,以科技创新带动警务工作创新,以资源整合带动警务工作整合,充分发挥政府其它各行政部门、城管、社区联防的力量,形成党委领导、政府组织、公安管理、警民联动、全社会齐抓共管的的社会治安综合管理的新局面,为进一步构建城综合预警系统和应急指挥体系奠定基础。
都昌县智慧安防综合管理系统遵循GB/T 28181标准,采用先进的视频编解码技术、网络传输技术、智能视频分析技术、海量存储管理技术、高清视频采集传输和高清视频显示技术,高起点、全方位地加强视频图像信息系统的建设和整合,将公安、交通、政和社会视频监控资源集成到统一的管理平台,建成统一的规范化的视频图像信息系统。
都昌县智慧安防综合管理系统从城管理的全局需求出发,采用固定治安监控点与移动执法监控相结合、公安治安监控与社会治安监控相结合、视频监控与GIS系统相结合、人工监控与智能分析相结合、分布式管理与统一指挥管理相结合等方式,通过新建扩建、整合利用、升级改造和业务集成等途径,提高监控图像质量,扩大视频监控范围,整合现有各种视频资源,实现视频资源的共享和视频信息增值应用,最终建立全方位、立体化的多级监控联网管理体系。
1.3.1 系统体系架构规划
都昌县智慧安防综合管理系统采用“物联网+云计算”架构,按照面向服务(SOA)方式设计。系统集成了公安系统现有的联网视频监控、三台合一、电子警察、移动执法、警务可视化管理、远程侦讯等系统,以视频管理应用为核心,以智能报警联动为辅助,遵循28181联网规范,实现部、省、、区县、派出所的级联控制,实现各政府部门间的互联互控,实现城治安防控、交通管理和应急指挥的综合管理。
都昌县智慧安防系统技术架构分为感知层、网络层、基础设施层、数据资源层、平台层、应用层、表现层,以及标准、规范、安全、技术支持、服务和运维管理等支撑体系。系统技术架构如下图所示::智慧安防系统技术架构
感知层
感知层主要完成数据采集与数据处理任务,是整个系统的基础。主要包括音视频采集、气体探测、烟感探测、红外探测、微波探测等各种传感设备、电子标签、二维码等检测产品以及音视频服务器、信息读写器等数据处理设备。
网络层
网络层主要包括internet、通信网(PSTN、GSM、3G等)、公安网、公安视频专网等网络,实现数据、信令等信息的传递。
基础设施层
基础设施层提供计算、存储和备份服务。采用云计算方式部署和整合,利用虚拟化技术,实现硬件资源的整合、分配,按业务需要提供资源,优化资源配置。
数据资源层
数据资源层包括公安图像信息、社会图像信息、报警信息等采集上来的信息以及法规库、GIS数据、涉案车辆信息、追讨信息等共享信息。 平台层
平台层是系统的核心,承担着设备接入、数据共享、数据管理、应用集成等任务。主要采用EAI应用集成、ESB服务总线、ETL数据抽取、挖掘等技术。
应用层
本系统的主要应用系统包括治安视频监控、智能卡口、电子警察、三台合一、应急指挥、可视化督察、远程侦讯、GIS服务等基本应用,及案件视频侦查和智能运维等实战应用。
表现层
系统以都昌县智慧安防综合管理平台的界面呈现,主要服务对象包括公安、相关政府部门、企事业单位及个人。
1.3.2 系统拓扑结构
图2 :智慧安防系统拓扑图
都昌县智慧安防综合管理系统部署遵循G/T 28181标准,在原、区县、派出所三级管理中心基础上增加了与省厅的互联互控,并设立了社会资源接入中心。
(一)省厅管理中心。省厅管理中心并不直接参与都昌县智慧安防管理工作,建设重点是可视化指挥通信,采用统一通信技术进行整体调度和业务协同设计。
(二)级指挥中心。级指挥中心担负着接处警、综合监控和应急指挥的综合任务,是系统的大脑,所有的分局、派出所均受其管理,同时向省厅管理中心负责。建设的重点是统一指挥调度和视频监控综合管理平台。(三)区县分局监控中心。区县级管理中心是都昌县智慧安防综合管理的直接执行部门,是资源的第一汇聚中心,接受指挥中心的管理。建设的重点是视频综合管理。
(四)派出所管理中心。作为基础单位,管理辖区内的设备和客户端、接受区县管理中心的管理。
(五)交通管理监控中心。接入交通管理相关视频,并接受上级区县监控中心的管理。
社会资源接入管理中心。通过直接接入或共享接入的方式将社会资源转换为符合公安专网传输的格式,接入区县级管理中心。
1.4 智慧安防系统规划
增加监控覆盖面积、扩大视频图像信息系统的覆盖范围。从城重点区域、部位向周边地区辐射,逐步扩展到各区县、乡镇的重要部位、主要道路和交叉路口。
提高视频探头总量、加大监控覆盖密度。通过新建、扩建监控点,增加视频探头总量。并通过升级、改造现有的视频探头,提高图像信息系统的视频质量。最终实现“整体布局网格化、局部区域闭合化、重点路口全摄入和重点部位全覆盖”。 建设以高清视频为主的视频图像信息系统。新建的图像信息系统以部署高清视频监控为主,并根据需求逐步完成对原有视频探头的升级改造。从高清视频的数据采集、网络传输、视频存储、交换显示等多方面着手进行新老系统的建设以及改造工作,各个环节均满足高清视频监控的需求。 切合实战需求,加大高清治安卡口和高清卡口式电警建设力度。站在“大公安”的角度构筑高效的、切合实战应用需求的“立体防控体系”,通过建立城际、城郊、城区三道防线严密治安防控体系,全面掌控重要路口、路段的状况和通行车辆信息。
统一规范,实现视频资源的整合共享。建成“统一编解码标准、统一联网协议、统一控制协议、统一编号规则、统一图像标注、统一位置标识”的视频管理系统,整合各类不同来源、不同格式的视频图像资源,实现视频管理信息系统的数字化、网络化和智能化。
建设基于PGIS的视频图像信息系统。依托警用电子地理信息系统,通过视频图像信息与空间地理信息的融合,实现视频图像信息、视频前端属性、视频区域信息、警力分布信息、应急联动信息、以及各类基础数据信息的同步显示。整合城各种应急资源,以视频管理系统、地理信息系统、数据分析系统、信息展现系统为手段,实现对事件数据的收集、分析和辅助决策,对各类资源的组织、协调和管理控制等指挥调度功能,使其成为支撑城应急联动系统和“电子政府”的信息基础设施。
1.5 关键技术路线
1.5.1 标准与协议
(一)视频压缩编码标准—H.264/AVC 1)基本概况
H.264是ITU-T以H.26x系列为名称命名的视频编解码技术标准之一。目前国际上制定视频编解码技术的组织有两个,一个是“国际电联(ITU-T)”,它制定的标准有H.261、H.263、H.263+等,另一个是“国际标准化组织(ISO)”它制定的标准有MPEG-
1、MPEG-
2、MPEG-4等。而H.264则是由两个组织联合组建的联合视频组(JVT)共同制定的新数字视频编码标准,所以它既是ITU-T的H.264,又是ISO/IEC的MPEG-4高级视频编码(Advanced Video Coding,AVC),而且它将成为MPEG-4标准的第10部分。因此,不论是MPEG-4 AVC、MPEG-4 Part 10,还是ISO/IEC 14496-10,都是指H.264。
H.264是ITU-T的VCEG(视频编码专家组)和ISO/IEC的MPEG(活动图像编码专家组)的联合视频组(JVT:joint video team)开发的一个新的数字视频编码标准,它既是ITU-T的H.264,又是ISO/IEC的MPEG-4的第10 部分。1998年1月份开始草案征集,1999年9月,完成第一个草案,2001年5月制定了其测试模式TML-8,2002年6月的 JVT第5次会议通过了H.264的FCD板。2003年3月正式发布。在2005年又开发出了H.264的更高级应用标准MVC 和SVC版本。
2)算法优势
H.264是在MPEG-4技术的基础之上建立起来的,其编解码流程主要包括5个部分:帧间和帧内预测(Estimation)、变换(Transform)和反变换、量化(Quantization)和反量化、环路滤波(Loop Filter)、熵编码(Entropy Coding)。
H.264/MPEG-4 AVC(H.264)是1995年自MPEG-2视频压缩标准发布以后的新一代的视频压缩标准。通过该标准,在同等图象质量下的压缩效率比以前的标准提高了2倍以上,因此,H.264被普遍认为是最有影响力的行业标准。
3)技术背景
H.264标准的主要目标是:与其它现有的视频编码标准相比,在相同的带宽下提供更加优秀的图象质量。
H.264与以前的国际标准如H.263和MPEG-4相比,为达到高效的压缩,充分利用了各种冗余,统计冗余和视觉生理冗余。a)统计冗余
频谱冗余(指色彩分量之间的相关性),空间冗余,还有时间冗余。这是视频压缩区别于静止图像的根本点,视频压缩主要利用时间冗余来实现大的压缩比。
b)视觉生理冗余
视觉生理冗余是由于人类的视觉系统(HVS)特性造成的,比如人眼对色彩分量的高频分量没有对亮度分量的高频分量敏感,对图像高频(即细节)处的噪声不敏感等。
针对这些冗余,视频压缩算法采用了不同的方法加以利用,但主要的考虑是集中在空间冗余和时间冗余上。H.264也采用混合(hybrid)结构,即对空间冗余和时间冗余分别进行处理。对空间冗余,标准通过变换及量化达到消除的目的,这样编码的帧叫I帧;而时间冗余则是通过帧间预测,即运动估计和补偿来去除,这样编码的帧叫P帧或B帧。与以前标准不同的是,H.264在编码I帧时,采用了帧内预测,然后对预测误差进行编码。这样就充分利用了空间相关性,提高了编码效率。H.264帧内预测以16x16的宏块为基本单位。首先,编码器将与当前宏块同一帧的邻近像素作为参考,产生对当前宏块的预测值,然后对预测残差进行变换与量化,再对变换与量化后的结果做熵编码。熵编码的结果就可以形成码流了。由于在解码器端能够得到的参考数据都是经过反变换与反量化后的重建图像,因此为了使编解码一致,编码器端用于预测的参考数据就和解码器端一样,也是经过反变换与反量化后的重建图像。
4)特征优势
H.264是国际标准化组织(ISO)和国际电信联盟(ITU)共同提出的继MPEG4之后的新一代数字视频压缩格式,它即保留了以往压缩技术的优点和精华又具有其他压缩技术无法比拟的许多优点。
a)低码率(Low Bit Rate):和MPEG2和MPEG4 ASP等压缩技术相比,在同等图像质量下,采用H.264技术压缩后的数据量只有MPEG2的1/8,MPEG4的1/3。显然,H.264压缩技术的采用将大大节省用户的下载时间和数据流量收费。
b)高质量的图象:H.264能提供连续、流畅的高质量图象(DVD质量)。c)容错能力强:H.264提供了解决在不稳定网络环境下容易发生的丢包等错误的必要工具。
d)网络适应性强:H.264提供了网络抽象层(Network Abstraction Layer),使得H.264的文件能容易地在不同网络上传输(例如互联网,CDMA,GPRS,WCDMA,CDMA2000等)。H.264最大的优势是具有很高的数据压缩比率,在同等图像质量的条件下,H.264的压缩比是MPEG-2的2倍以上,是MPEG-4的1.5~2倍。举个例子,原始文件的大小如果为88GB,采用MPEG-2压缩标准压缩后变成3.5GB,压缩比为25∶1,而采用H.264压缩标准压缩后变为879MB,从88GB到879MB,H.264的压缩比达到惊人的102∶1。低码率(Low Bit Rate)对H.264的高的压缩比起到了重要的作用,和MPEG-2和MPEG-4 ASP等压缩技术相比,H.264压缩技术将大大节省用户的下载时间和数据流量收费。尤其值得一提的是,H.264在具有高压缩比的同时还拥有高质量流畅的图像,正因为如此,经过H.264压缩的视频数据,在网络传输过程中所需要的带宽更少,也更加经济。(二)会话控制协议—SIP(Seion Initiation Protocol)SIP(Seion Initiation Protocol)是一个应用层的信令控制协议。用于创建、修改和释放一个或多个参与者的会话。这些会话可以是Internet多媒体会议、IP电话或多媒体分发。会话的参与者可以通过组播(multicast)、网状单播(unicast)或两者的混合体进行通信。
1)SIP组件
SIP 会话使用多达四个主要组件:SIP 用户代理、SIP 注册服务器、SIP 代理服务器和 SIP 重定向服务器。这些系统通过传输包括了 SDP 协议(用于定义消息的内容和特点)的消息来完成 SIP 会话。下面概括性地介绍各个 SIP 组件及其在此过程中的作用。
a)SIP 用户代理
SIP 用户代理(UA)是终端用户设备,如用于创建和管理 SIP 会话的移动电话、多媒体手持设备、PC、PDA 等。用户代理客户机发出消息。用户代理服务器对消息进行响应。
b)SIP 注册服务器
SIP 注册服务器是包含域中所有用户代理的位置的数据库。在 SIP 通信中,这些服务器会检索参对方的 IP 地址和其他相关信息,并将其发送到 SIP 代理服务器。
c)SIP 代理服务器
SIP 代理服务器接受 SIP UA 的会话请求并查询 SIP 注册服务器,获取收件方 UA 的地址信息。然后,它将会话邀请信息直接转发给收件方 UA(如果它位于同一域中)或代理服务器(如果 UA 位于另一域中)。
d)SIP 重定向服务器
SIP 重定向服务器允许 SIP 代理服务器将 SIP 会话邀请信息定向到外部域。SIP 重定向服务器可以与 SIP 注册服务器和 SIP 代理服务器同在一个硬件上。
2)SIP在安全防范视频监控联网中的作用
SIP在新颁布的《安全防范视频监控联网系统信息传输、交换、控制技术要求》GB/T 28181-2011中指定为联网标准协议。联网通信结构协议如下:
联网系统在进行视音频传输机控制时应建立两个传输通道:会话通道和媒体流通道。会话通道用于在设备间建立会话并传输系统控制命令;媒体流通道用于传输视音频数据,经过压缩编码的视音频刘采用流媒体协议RTP/RTCP传输。联网方式有如下三种:
a)SIP监控域级联
图3 :信令级联结构示意图
图4 :媒体级联结构示意图
b)SIP监控域互联
图5 :媒体互联结构示意图
图6 :信令互联结构示意图
c)SIP监控域与非SIP监控域互联
图7 :SIP监控域与非SIP监控域互联结构示意图 1.5.2 云计算与云存储
(一)云计算
云计算是继1980年代大型计算机到客户端-服务器的大转变之后的又一种巨变。
云计算(Cloud Computing)是分布式计算(Distributed Computing)、并行计算(Parallel Computing)、效用计算(Utility Computing)、网络存储(Network Storage Technologies)、虚拟化(Virtualization)、负载均衡(Load Balance)等传统计算机和网络技术发展融合的产物。
通过使计算分布在大量的分布式计算机上,而非本地计算机或远程服务器中,企业数据中心的运行将与互联网更相似。这使得企业能够将资源切换到需要的应用上,根据需求访问计算机和存储系统。好比是从古老的单台发电机模式转向了电厂集中供电的模式。它意味着计算能力也可以作为一种商品进行流通,就像煤气、水电一样,取用方便,费用低廉。最大的不同在于,它是通过互联网进行传输的。
云计算可以认为包括以下几个层次的服务:基础设施即服务(IaaS),平台即服务(PaaS)和软件即服务(SaaS)。
IaaS(Infrastructure-as-a-Service):基础设施即服务。消费者通过Internet可以从完善的计算机基础设施获得服务。
PaaS(Platform-as-a-Service):平台即服务。PaaS实际上是指将软件研发的平台作为一种服务,以SaaS的模式提交给用户。因此,PaaS也是SaaS模式的一种应用。但是,PaaS的出现可以加快SaaS的发展,尤其是加快SaaS应用的开发速度。
SaaS(Software-as-a-Service):软件即服务。它是一种通过Internet提供软件的模式,用户无需购买软件,而是向提供商租用基于Web的软件,来管理企业经营活动。
云计算(Cloud Computing)是分布式处理(Distributed Computing)、并行处理(Parallel Computing)和网格计算(Grid Computing)的发展,或者说是这些计算机科学概念的商业实现。是指基于互联网的超级计算模式,即把存储于个人电脑、移动电话和其他设备上的大量信息和处理器资源集中在一起协同工作。在极大规模上可扩展信息技术的能力,并向外部客户作为服务来提供的一种计算方式。
图8 :云计算的产生
云计算的基本原理是通过使计算分布在大量的分布式计算机上,而非本地计算机或远程服务器中,企业数据中心的运行将更与互联网相似。这使得企业能够将资源切换到需要的应用上,根据需求访问计算机和存储系统。它具有如下特点:①云计算提供最安全可靠的数据存储中心。②云计算对用户端的设备要求最低,使用起来也最方便。③云计算可以实现不同设备间的数据交换与应用共享。
用户数据中心访问服务监控管理资源云管理员软件库发布更新软件软件开发者 图9 :云计算的原理图
具有强大数据分析能力的云计算平台是智慧城发展的决定性因素,是智慧城的“大脑”,它能实现智慧城所需要的海量数据的计算与存储。在智慧城的架构中,云计算的核心价值体现在以下几点:①统筹共享城系统资源。②促进智慧应用间的数据交换,应用协同。③按需的基础设施服务。④一体化的数据管理分析。⑤加速应用服务提供。⑥便捷化的第三方应用集成。⑦城系统平滑演进能力。
(二)云存储
云存储是在云计算(cloudcomputing)概念上延伸和发展出来的一个新的概念,是指通过集群应用、网格技术或分布式文件系统等功能,将网络中大量各种不同类型的存储设备通过应用软件集合起来协同工作,共同对外提供数据存储和业务访问功能的一个系统。云存储对使用者来讲,不是指某一个具体的设备,而是指一个由许许多多个存储设备和服务器所构成的集合体。使用者使用云存储,并不是使用某一个存储设备,而是使用整个云存储系统带来的一种数据访问服务。所以严格来讲,云存储不是存储,而是一种服务。云存储的核心是应用软件与存储设备相结合,通过应用软件来实现存储设备向存储服务的转变。与传统的存储设备相比,云存储不仅仅是一个硬件,而是一个网络设备、存储设备、服务器、应用软件、公用访问接口、接入网、和客户端程序等多个部分组成的复杂系统。各部分以存储设备为核心,通过应用软件来对外提供数据存储和业务访问服务。
云存储不仅仅是存储,更多的是应用。应用存储是一种在存储设备中集成了应用软件功能的存储设备,它不仅具有数据存储功能,还具有应用软件功能,可以看作是服务器和存储设备的集合体。应用存储技术的发展可以大量减少云存储中服务器的数量,从而降低系统建设成本,减少系统中由服务器造成单点故障和性能瓶颈,减少数据传输环节,提供系统性能和效率,保证整个系统的高效稳定运行。
1.5.3 智能视频分析技术
智能视频(Intelligent Video)技术源自计算机视觉(Computer Vision)与人工智能(Artificial Intelligent)的研究,其发展目标是在图像与事件描述之间建立一种映射关系,使计算机从纷繁的视频图像中分辩、识别出关键目标物体。这一研究应用于安防视频监控系统,将能借助计算机强大的数据处理能力过滤掉图像中无用的或干扰信息,自动分析、抽取视频源中的关键有用信息,从而使传统监控系统中的摄像机成为人的眼睛,使“智能视频分析”计算机成为人的大脑,并具有更为“聪明”的学习思考方式。这一根本性的改变,可极大地发挥与拓展视频监控系统的作用与能力,使监控系统具有更高的智能化,大幅度节省资源与人员配置,同时必将全面提升安全防范工作的效率。因此,智能视频监控不仅仅是一种图像数字化监控分析技术,而是代表着一种更为高端的数字视频网络监控应用。
智能视频分析包含视频诊断、视频分析和视频增强等,它们各自又包含了大量的功能算法,比如清晰度检测、视频干扰检测、亮度色度检测、PTZ(云台)控制功能检测,以及视频丢失、镜头遮挡、镜头喷涂、非正常抖动等检测都属于视频诊断内容,而视频分析算法则包含区域入侵、绊线检测、遗留遗失检测、方向检测、人群计数、徘徊检测、流量统计、区域稠密度统计、人脸识别、车牌识别、烟火烟雾检测、自动PTZ跟踪等功能,视频图像增强则包括稳像、去雾、去噪、全景拼接等算法。由此组合衍生出的算法种类又有很多,应用方式也千变万化,所以智能视频分析的应用范围很广。
(一)视频诊断
1)清晰度检测
自动检测视频中由于聚焦不当、镜头损坏或异物遮蔽引起的视野主体部分的图像模糊;自动检测镜头对准无意义物体的情况。该功能对实时视频的画面清晰程度和信息含量做出评价,从而及时发现故障(如偶然的异物遮挡、人为的遮蔽等)。“骤变”作为此功能在周界防范技术领域的应用延伸,目前已普遍得到人们的认可。
2)视频噪声检测
自动检测视频图像中图像模糊、扭曲、雪花或滚屏等噪声现象,主要的监测对象是由于线路老化、传输故障、接触不良或受到电磁干扰而在视频画面上出现的点状、刺状、带状的干扰。在视频质量诊断系统中,呈带状、网状带有周期性的干扰一般交由“雪花”检测项监测,而点状、刺状的随机干扰则交由“噪声”检测项监测,从而提高诊断的准确性。
图10 :噪声干扰画面
3)锐度检测
检测由于聚焦不当、镜头损坏或灰尘引起的视野主体部分的图像模糊,或者镜头对准无意义物体(白墙等)的情况。
图11 :锐度检测原理示意图
图12 :锐度异常画面
4)亮度异常检测
自动检测视频中由于摄像头故障、增益控制紊乱、照明条件异常或人为恶意遮挡等原因引起的画面过暗、过亮或黑屏现象。该功能将对视频的明暗程度进行诊断,由于可在不同时段改变诊断计划和监测阈值,在昼夜都能发挥作用。
图13 :亮度异常画面
5)偏色检测
自动检测由于线路接触不良、外部干扰、AWB失效或摄像头故障等原因造成的画面偏色现象,主要包括全屏单一偏色或多种颜色混杂的带状偏色。该功能对视频的颜色信息进行分析,其特点是当视频中出现丰富色彩时,能够区分它们是由自然场景带来的,还是由于摄像头镜身故障产生的。
图14 :偏色画面
6)PTZ(云台)控制功能诊断
自动检测前端云台和镜头是否能够按用户指令正确运动,如有无左转失灵、上下倒序等故障。该功能能够自动对PTZ的各指令进行测试,使管理人员准确及时地把握系统内PTZ的运行情况。不过,此功能需要系统拥有控制前端PTZ的权限。
7)视频冻结检测
自动检测由于视频传输调度系统故障引起的视频画面冻结现象,可避免错失真实的现场视频图像。
8)视频抖动检测
检测因摄像头长期在室外工作,固定支架松动造成的图像受到严重干扰,画面抖动的情况。
图15 :视频抖动检测
9)人为遮挡画面
检测因摄像头长期在室外工作引起的灰尘遮挡的情况,检测人为恶意遮挡或图像被替换的情况(可以进行报警)。
图16 :人为遮挡画面
10)视频缺失检测
自动检测因前端云台、摄像机工作异常、损坏、遭人为恶意破坏,或是视频传输环节故障而引起的间发性或持续性的视频缺失现象(当视频丢失时,一般采取人工补假图的方法来处理)。
图17 :视频丢失检测
(二)视频分析
视频分析方法主要有背景模型法和时间差分法两类。背景模型法是利用当前图象和背景图象的差分(SAD)来检测出运动区域,可以提供比较完整的运动目标特征数据,精确度和灵敏度比较高,具有良好的性能表现。背景的建模和自适应是背景模型法的关键,一般在系统设置时期设置系统自适应学习时间来建模,根据背景实际“热闹程度”选取3~5分钟的学习时间。系统建模完成后,随着时间的变化,背景会有相应的改变,而系统具有“背景维护”能力,可以将一些后来融入背景的图象,如云等自动加为背景。时间差分法就是高级的VMD,又称相邻帧差法,即利用视频图像特征,从连续得到的视频流中提取所需要的动态目标信息。时间差分法的实质就是将相邻帧图像相减来提取前景目标移动的信息。此方法不能完全提取所有相关特征像素点,只能检测出目标的边缘,在其提取的运动实体内部可能出现空洞。
视频分析的过程(背景模型法)是:首先,系统进行背景学习,学习时间因背景热闹程度不同而有所不同,期间系统自动建立背景模型;之后,系统进入“分析”状态,如果前景出现移动物体,且处在设置的范围区域内、大小满足设置,系统将会对该目标进行提取和跟踪,并根据预设的算法(入侵、遗留、盗窃等)触发报警(期间如果背景中出现雨雪、中云、波浪、摇摆的柳树等物体,或发生摄像机抖动的情况,系统将启动预处理功能来加以过滤)。在触发报警之前,系统能够进行目标识别,即将提取的目标与已经建立的模型进行比对,并选择最佳的匹配。
1)区域入侵监测
识别出目标沿一定轨迹进入、离开标定区域的事件,识别出目标在标定区域内的出现或消失,识别出目标在标定区域内存在与否。
2)绊线检测
识别出单方向、双方向穿越警戒线的行为;识别出逆行、转向等行为;识别物体运行方向,对逆行等行为进行报警。
3)物体遗失检测
在指定区域内的物品被偷盗、搬移、取走时发出声光报警信息。
4)物体遗留检测
识别出在标定区域内出现的,遗留、遗弃的单件、多件物品,可设定遗留报警时间。
方向检测 识别物体运行方向,对逆行等行为进行报警。
5)徘徊检测
识别出人员或车辆在标定区域内长时间徘徊与滞留的可疑情况,可设定徘徊报警的时间和人数。
6)人群流量统计(计数)
单向、双向累计人流统计,包含人群稠密度检测。
7)方向检测 识别物体运行方向,对逆行等行为进行报警
8)对象识别(人、车辆和物区分)与轨迹识别
对视场内人员、车辆、物品、动物等目标进行分类判别,对视场内已识别目标的行动轨迹、速度、方向、距离进行跟踪。
9)PTZ动态跟踪
通过智能视觉技术锁定目标后(支持自动、手动、接力三种锁定模式),自动控制PTZ摄像机的云台旋转以跟踪目标,确保可疑目标的放大画面特写始终保持在视频画面中央,并在目标离开视场后自动回到预置位。其开发难点是出现目标交叉、被遮挡等干扰后如何识别并成功地继续跟踪。
10)人脸识别
根据人的脸部特征进行采集和抓拍,并能进行比对分析,在发现可疑人员时给予报警提示。
11)车牌识别
能够做到自动记录并分析判断车辆的身份,对于有不良身份记录的车辆进行提前预警。
12)烟火监测
能够自动监测防区内突发的火情,发出报警并触发其他动作。
(三)视频增强
1)图像增强
改善雾、雨、雪环境下的视频效果,提高画面的能见度。
2)图像稳像
消除位于铁路边、公路边的摄像机所拍摄图像的震动、抖动、晃动。3)数字全景拼接
对监控系统获得的多个相关联的分散场景画面进行无缝拼接,在不降低视频帧率情况下实现全景监控。
1.5.4 基于内容的视频检索
视频搜索是通过对海量的非结构化的视频数据进行结构化分析,提取视频内容的特征(包含语义特征),在此基础上实现从内容上对视频进行检索。与传统文本搜索相比,视频搜索存在很大的技术难度。首先,视频内容的特征难以提取与处理,特别是语义特征的提取存在很大的困难。其次,视频搜索在索引建立、查询处理以及人机交互等方面都与传统的文本搜索存在很大区别,还有一些技术难题有待解决。
(一)视频结构化分析
视频结构化分析是指对视频流进行镜头分割、关键帧提取和场景分割等处理,从而得到视频的结构化信息。
镜头分割的关键在于确定镜头的边界,其中渐变镜头边界的检测目前仍然是一个具有挑战性的课题。现有镜头分割方法多以视频内容的不连续性为划分镜头的依据。研究者们通常选取视频的某种特征来度量视频内容的不连续性,如颜色特征、运动矢量特征、边缘特征等。
由于同一个镜头中的各帧图像之间的内容有相当程度的冗余,因此可以选取反映镜头中主要信息内容的帧图像作为关键帧。镜头分割后,对每个镜头可提取若干关键帧,并用关键帧来简洁地表示镜头。
场景分割通常也称为故事单元分割,其目标在于获取视频的最小语义结构单元——场景。一般而言,场景是由一组连续的、同属于一个故事单元的多个镜头组成。通过融合视频的文本、声音等信息对已分割出的镜头进行聚类,将内容相近的连续镜头合并为一个单元组,从而得到场景信息,为进一步进行视频内容分析提供基础。
(二)特征提取
特征提取是进行视频搜索的基础,要实现有效查询,就必须对视频信息进行建模和表示,实际上就是分析视频数据,提取描述特征。一般说来,主要提取以下特征:
视觉特征:主要包括视频帧图像的颜色、纹理、形状、运动等低层视觉特征。其中,David G.Low于1999年提出了一种对图像缩放、旋转和仿射变换保持不变的图像局部特征描述算子——SIFT(Scale Invariant Feature Transform)算子,在图像和视频检索中越来越受到人们的重视。
听觉特征:听觉特征反映了视频中音频的频谱分布和变化规律、节奏、韵律等,主要包括:短时能量、MFCC系数、基音频率、分带短时能量、短时能量的均值和方差、MFCC系数的均值和协方差、过零率的均值和方差等。
文本特征:作为视频高层语义的一种,视频字幕、视频语音、以及互联网Web中的相关文本信息是不必通过语义推理的视频高层语义内容,它对视频内容有很强的描述作用,因而对视频的高层语义分析具有很重要的价值。主要包括以下:
ASR文本:视频中一般总是伴随着人说话的声音,我们称这种声音为语音。利用自动语音识别技术,我们可以将语音转换为文本信息。在特定的视频中,反映主题的并且检索频率较高的语音词汇往往在视频局部多次重复出现,即使语音识别引擎不能每次都正确识别,但只要识别一两个实例,也能迅速定位所需要的视频片段。
字幕文本:视频帧中出现的文字,特别是后期编辑叠加的文本字幕,经常包含了重要的语义信息,如新闻视频中的主题、日期和人名,以及电影视频中的演员表等。最后利用面向视频的文字识别技术(Video OCR)检测与识别视频中的文本信息。
Web文本:在Web 页面中,常有一些与视频相关的外部文本信息,如与新闻视频相关的讲稿或文字报导、与足球比赛相关的文字直播或比赛战况播报等等。通过对Web 页面中文本和视频的空间相关性等信息进行挖掘和融合,通常能获得与当前视频相关的语义信息。基于以上文本特征,借助领域相关的命名实体词典和相关知识库,可提取包含时间、地点、人物以及描述事件的关键词等信息,以支持特定时间、地点、人物以及事件的检索。
其它特征:如视频中是否存在人脸,以及摄像机的运动特征等。人脸是视频中常见对象,并且蕴涵了丰富的语义信息。
(三)语义概念(高级语义特征)提取
多媒体信息检索已经有数十年的历史,最初的多媒体检索是人对多媒体信息进行手工文字标注,然后通过一般文本检索技术来实现多媒体检索。后来,人们提出通过媒体的低层特征(如帧图像的颜色、纹理、形状、视频的运动特征)对多媒体信息进行基于内容的检索。实际上,人们经常在日常生活中习惯使用诸如“飞机、建筑、天空、海滩、日出、花草树木、轮船”等概念,因而往往希望能够进行基于语义的查询,这就需要利用多媒体数据的高层语义信息。如何建立视频的低层特征和高层语义描述之间的映射,有效克服所谓的“语义鸿沟”,是一直以来困扰科研人员的技术难点,也是当前的一个研究热点。
图18 :视频语义概念提取的一般流程
虽然目前从事视频语义概念提取技术研究的单位很多,出现了众多各具特色的系统方案。但就整体而言,这些系统大多由特征提取、分类器模型、融合算法和上下文关联分析这四部分组成。
视频语义概念提取所用的特征主要来自如前所述的视觉、听觉、文本等特征,我们需要根据它们各自的特点选用合适的分类器模型。另外,因为视频语义概念大多都具有正样本数少、相关性强的特点,这对分类器模型的使用提出了更高的要求。通常采用的分类器模型有三类:一类是直接将各种全局或局部的特征组成特征向量,利用通用的分类器算法,如SVM、GMM、最大熵、KNN等进行语义概念的检测;另一类是考虑特征之间的时间/空间关联,利用隐马模型进行建模;还有一类模型,将局部特征聚类形成中间分组,在对测试序列求得分组标注后,利用全局的分组直方图进行分类。
也可单独从视频文本中直接提取出反映高层语义的概念。由于视频文本通常不准确,不完整,甚至有很多错误(如ASR带来的识别错误,字幕文字识别错误),因此很难用自然语言理解的方法来分析视频文本中的语义。目前大多采用各种统计的方法,如N-Gram文法和隐性语义索引(LSI,Latent Semantic Indexing)等,分析已经存在的大规模语料库,从中学习相关规则,然后用这些规则来推断可能包含的语义。
为获得对视频更全面准确的理解,我们需要融合各个模态的信息。信息的融合大致可以分为两个层次:第一个层次为同一模态内的不同特征之间的信息融合;第二个层次为不同模态间的信息融合。两种层次的融合方法是统一的,分为非启发式的融合方法和启发式的融合方法。非启发式的融合方法主要包括:平均加权、取最大值、取最小值、乘积等各种融合方法。非启发式的融合方法的主要优点是不需要对融合方法进行训练,应用简单,鲁棒性较强,但是融合效果一般。启发式的融合方法主要包括:Adaboost方法、加权融合方法(Weighted Average)、基于排序的加权融合方法(Ordered Weighted Average)。启发式的融合方法针对不同的数据进行融合参数的训练,融合效果较好,但是鲁棒性稍差,计算复杂度也要比非启发式融合方法大很多。
不同的语义概念之间往往存在一些上下文(Context)约束或者共生关系。比如检测到“天空”和“绿地”会增加检测到“风景”的概率,而减少检测到“室内”的概率。如果仅建立一组单独的概念检测算法,则无法充分利用这些信息。因此,还需要进行上下文关联分析,利用不同概念之间的相互关系,进一步改进概念检测的结果。上下文关联分析算法主要有MultiNets、SVM判别融合方法,以及基于本体论的方法等。
(四)高维索引
从视频中提取特征之后,帧图像被映射为高维特征空间中的样本点。对于海量数据而言,如何建立有效的索引结构,是加快检索速度、提高检索精度的关键问题。同时,由于特征的维数很高,常用的索引方法难以满足需要,具有动态性、高效性、鲁棒性的高维索引结构已成为热门的研究方向。
常用的高维索引是树型空间索引,目前普遍采用R树作为索引的数据结构。针对R树结构受数据输入次序影响的问题,R树采用强制重新插入策略,对树中已有节点中的单元进行有选择的重新插入,优化树的整体结构,有助于提高查询性能。其代价仅稍高于R树,同时支持点数据和其它空间数据的索引建立与查询。
大部分树型空间索引在低维空间中性能优越,但在高维空间中,性能显著下降,这是因为一些重要的参数,如体积、面积等,都与空间维数呈幂级增长的关系。因此,应对高维特征进行降维处理,常用的方法有主成分分析和聚类等方法。
(五)查询处理与相关反馈
查询处理是指处理用户查询的需求,将之转换为可以执行检索的特征向量,以便与索引结构相匹配。用户提交的查询一般是对查询内容的简洁描述,在检索过程中需要对其进行扩展。扩展方法主要有基于规则的扩展和基于统计的扩展。前者利用现有的词典,如HowNet、WordNet、同义词林等查找语义上与该查询相似的词,对其赋予一定的权重后加入查询中。后者统计大规模预料库中与查询词共现最多的词,作为相关词加入到新的查询中。
在交互式搜索(Interactive Search)系统中,还需要处理用户的反馈信息,从而调整查询算法,以期获得更加符合用户意愿的查询结果。
相关反馈是指根据用户对于检索结果的反馈,其中既包括检索正确的正反馈,也包括检索错误的负反馈(有的系统返回的是用户对检索结果是否正确的置信度),对查询处理结果做适当的调整,如增加产生正反馈的权重,降低导致负反馈的权重等。相关反馈技术是一种有效的交互手段,已经被越来越多的搜索引擎所采用。好的相关反馈算法可以普遍提高检索结果精度,使用户能快速检索到自己需要的结果。另外,由于不同的用户反馈反映了不同用户的偏好,因而相关反馈有利于实现用户的个性化搜索。
(六)多模态人机界面
多模态人机界面涉及多模态方式输入用户界面和输出界面,是系统中必不可少的非常关键的组成部分。用户通过多模态的人机界面与系统交互:输入查询、输出结果或对结果进行反馈。
在实际应用中,很多用户对于某些语义概念的掌握程度可能不足以明确表达其查询意愿。如果系统允许用户以多模态的描述方式,比如提交一段文本、一幅或多幅样例图像、一段或多段样例视频片段、一段语音等,来输入查询意愿,那么系统将搜索到更多符合用户要求的查询结果。
系统的输出也是一个多模态表示的结果,如关于视频数据的描述信息、一系列相关的图像、一组相关的镜头等等。为全面反映结果的内容,便于用户快速抓住感兴趣的结果和进行更有效的反馈和评价,通常对结果进行层次化组织,并以可视化方式输出。例如,可用“故事板”方式将一些关键帧图像在窗口中平铺,通过点击关键帧图像,用户便可浏览相应的镜头内容。
(七)语义检索框架
视频语义检索可以通过前述的语义概念提取实现,主要包括从文本或视觉等多模态特征中提取相应的语义概念。其典型算法如图2所示。
首先,对于一个特定的查询,需要将该查询转换到语义概念空间。对于文本查询,可以通过词典或相关Web文本进行扩展,确定查询在语义概念空间的坐标;对关键帧样例查询,可以通过NDK(Near Duplicate Keyframes)等方法进行扩展,从中提取语义信息。然后,将检索分为两层:故事单元层和镜头层,分别利用多模态低层特征和高级语义特征(语义概念)进行检索。
图19 :语义检索的典型框架
最后,通过伪相关反馈(Pseudo Relevance Feedback)进一步提高检索精度,即根据前一次检索的结果,自动选取前几项作为正样本,返回给系统进行第二次查询,整个过程不需要用户参与而自动执行,因而称为伪相关反馈。
1.5.5 虚拟现实技术
虚拟现实(Virtual Reality,简称VR)是近年来出现的高新技术,是利用电脑模拟产生一个三维空间的虚拟世界,提供使用者关于视觉、听觉、触觉等感官的模拟,让使用者如同身历其境一般,可以及时、没有限制地观察三度空间内的事物。它用计算机生成逼真的三维视觉,使人自然地对虚拟世界进行体验和交互作用。该技术集成了计算机图形(Computer Graphics,简称CG)技术、计算机仿真技术、人工智能、传感技术、显示技术、网络并行处理等技术的最新发展成果,是一种由计算机技术辅助生成的高技术模拟系统。概括地说,虚拟现实是人们通过计算机对复杂数据进行可视化操作与交互的一种全新方式,与传统的人机界面以及流行的视窗操作相比,虚拟现实在技术思想上有了质的飞跃。
虚拟现实技术是可视化技术最有效的应用和发展,是由计算机生成的高级人机交互系统。在虚拟现实技术的支持下,虚拟城或Cyber City代替了传统的抽象地图和用来解释、分析和讨论城规划、建设进展的描述性文件,这种栩栩如生、身临其境的三维城模型,消除了设计专家和用户之间的空间文化差异。适应智慧城的特点,利用高层体系框架构建统一的分布式虚拟地理环境系统框架,可用于城地理多维信息的综合管理与多媒体集成发布、城规划、设计与决策,旅游、教育、培训及娱乐等。
图20 :虚拟现实技术操作界面
地理信息系统和空间信息可视化与虚拟现实技术的发展和应用,为实施智慧城战略提供了三维描述方法和人机交互的虚拟城环境,具有多维动态可视化和实时交互式操作的效果;地理信息系统具有强大的海量空间数据存储、管理、处理和空间分析功能。二者优势互补,集成与一体化是必然的发展趋势,用户可以在地理信息系统与虚拟现实集成框架和集成平台上,对城的规划、建设和管理方案进行模拟,以便更有效地实施城的规划、建设和管理。
1.5.6 异源异构数据集成技术
异源异构数据就是存在于各自独立的信息系统中,由于软硬件平台及数据模型的不同,从而数据存取方式、结构和精确度都不同,包括以关系表为代表的结构化数据、以XML为代表的半结构化数据和以文本文件为代表的无结构化数据。传统的数据查询方法是分别对不同数据源的数据进行查询,这样会导致查询结果只是孤立地反映某种情况,因此需要通过数据集成来对异构数据进行有效的查询和共享。
图21 :互联网中的异源异构数据
异构数据的集成是为了更好的利用分布在各处的数据资源,实现不同数据资源的合并和共享。可以通过网络建立跨部门、跨系统的数据交换平台,满足各信息管理系统之间的数据交换需要,为用户提供全方位的信息服务,并为管理者提供辅助决策的信息支持。
1.5.7 宽带无线通信技术
宽带无线通信是利用电磁波信号可以在自由空间中传播的特性进行信息交换的一种通信方式,目前使用较广泛的宽带无线通信技术包括无线局域网802.11(Wi-Fi)、3G通信技术和4G通信技术。
1)Wi-Fi技术
无线高保真(Wirele Fidelity,简称Wi-Fi)是一种无线通信协议,正式名称是IEEE802.11b,属于短距离无线通信技术,是一种可以将个人电脑、手持设备(如PDA、手机)等终端以无线方式互相连接,并提供无线宽带互联网访问的技术。
2)3G通信技术
第三代移动通信技术(3rd-Generation,简称3G),是指将无线通信与国际互联网等多媒体通信结合的新一代移动通信系统,能够同时传送声音及数据信息,支持高速数据传输和互联网接入,同时与第二代系统有良好的兼容性。
3G技术能极大地增加声音和数据传输的速度。3G能够达到300k-1M左右的速度,比家庭用ADSL宽带速度要快几倍,可以实现名副其实的移动宽带。
图22 :3G技术的应用
3)4G通信技术
第四代移动通信技术(4rd-Generation,简称4G),以传统通信技术为基础,并利用了一些新的通信技术,来不断提高无线通信的网络效率和功能,是集3G与WLAN于一体并能够传输高质量视频图像的技术。同时,4G通信是一种不需要电缆的信息超高速公路,这种新网络可使电话用户以无线及三维空间虚拟实境连线。
(1)4G技术的特点
通信速度更快。能够以100Mbps的速度下载,上传的速度能达到20Mbps,可以满足几乎所有用户对于无线服务的要求,实现更高质量的多媒体通信。
① 通信更加灵活。4G通信使人们不仅可以随时随地通信,更可以双向下载传递资料、图画、影像。
② 兼容性能更平滑。4G可集成不同模式的无线通信,从无线局域网、蜂窝信号、广播电视到卫星通信,用户可以自由地从一个标准漫游到另一个标准。
③ 使用效率更高。可以让更多的人使用与以前相同数量的无线频谱做更多的事情,而且速度更快。
④ 通信费用更加便宜。4G与固定宽带网络在价格方面不相上下,而且计费方式更加灵活,用户可以根据自身的需求确定所需的服务。
(2)4G技术的应用 ① 4G在智能手机中的应用
利用4G能在语音通话的同时双向传递数据,4G手机可根据环境、时间等因素来适时地提醒手机的主人所需要做的事。② 4G在移动/便携游戏中的应用
4G网络服务的速度优势和终端设备接入所提供的便捷有助于游戏的推广,人们可通过无线网络接受4G信息并传输到游戏设备中。
③ 4G在射频测量技术中的应用
随着射频技术的发展,对于射频测量提出更快速度,更高精度的要求。4G网络拥有的高频谱带宽,可在很大程度上满足射频测量的需求。
④ 其它应用
通过4G网络可以提供更好、更快和更便宜的医疗和应急服务,并在地震灾害等更多的应用中发挥作用。
(3)4G技术的标准
目前包括五个标准:WiMAX、HSPA+、LTE、LTE-Advanced 和WireleMAN-Advanced。
1.5.8 物联网技术
物联网(Internet of Things,简称IOT),也称为Web of Things。物联网是指通过各种信息传感设备,如传感器、射频识别(Radio Frequency Identification Devices,简称RFID)技术、全球定位系统、红外感应器、激光扫描器、气体感应器等各种装置与技术,实时采集任何需要监控、连接、互动的物体或过程,采集其声、光、热、电、力学、化学、生物、位置等各种需要的信息,与互联网结合形成的一个巨大网络。其目的是实现物与物、物与人,所有的物品与网络的连接,方便识别、管理和控制。
2009年9月,在北京举办的“物联网与企业环境中欧研讨会”上,欧盟委员会给出了欧盟对物联网的定义:
物联网是一个动态的全球网络基础设施,它具有基于标准和互操作通信协议的自组织能力,其中物理的和虚拟的“物”具有身份标识、物理属性、虚拟的特性和智能的接口,并与信息网络无缝整合。物联网将与媒体互联网、服务互联网和企业互联网一道,构成未来互联网。
物联网中非常重要的技术是RFID技术。它是20世纪90年代开始兴起的一种自动识别技术,是目前比较先进的一种非接触识别技术。一般来说,物联网开展工作的主要步骤如下:
① 标识需要连接的物体,获取物体有用的属性。
② 需要识别设备完成对物体属性的读取,并将信息转换为适合网络传输的数据格式。
③ 将物体的属性等信息通过网络传输到信息处理中心,由处理中心完成物体通信的相关计算。
物联网在智慧城市中的主要应用:····远程监控智能家居三表远抄家庭远程医疗„移动····移动支付移动票务城市一卡通...商务智慧交通·····城市车辆出入控制交通控制停车付费管理互动式导航...智慧城管·····环境监控市政管理远程路灯控制桥梁、河流监控...图23 :物联网在智慧城中的应用
物联网是都昌县的重要标志。通过互联网把无处不在的被植入城物体的智能化传感器连接起来,形成物联网,实现对物理城的全面感知,利用云计算等技术对感知信息进行智能处理和分析,实现网上“”与物联网的融合,并发出指令,对包括政务、民生、环境、公共安全、城服务、工商活动等在内的各种需求,做出智能化响应和智能化决策支持,使变为真正拥有智慧的。
1.5.9 ZigBee技术
ZigBee协议也称为IEEE 802.15.4标准,它是一种新兴的短距离低速无线个域网(Low Rate-Wirele Personal Area Network,LR-WPAN),不仅具有低成本、低功耗、低速率、低复杂度的特点;而且具有可靠性高、组网简单、灵活的优势。在短距离无线控制、监测、数据传输领域通用的技术。Zigbee是一个由可多到65000个无线数传模块组成的一个无线数传网络平台,每个网络节点间的距离可以从标准的75米,到扩展后的几百米,甚至几公里,并且节点间能相互通讯,它可工作在800MHz、900MHz、3.4GHz,数据率分别可达20kbps、40kbps、250kbps,特别适合于照明控制、环境控制、自动读表系统、各类窗帘控制、烟雾传感器、医疗监控系统、大型空调系统、机顶盒、万能遥控器、暖气控制、家庭安防、工业和楼宇自动等方面,如下图所示。
图24 :Zigbee技术拓扑图
1.5.10 海量数据挖掘处理技术
数据挖掘(Data Mining)就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。现有的城交通管理业务操作处理系统是由一些分散的、独立的、异构的计算机信息管理系统组成的庞大体系,这个体系中虽然积累了大量的城交通管理所需要的各种各样信息,由于没有一套有效的管理与分析方法,这些大量的信息成为“数据的海洋”而难以支撑现代城交通管理的分析需求,更谈不上智能。而在ITS中,数据挖掘技术能够响应国家ITS体系结构中系统整合思想,集成这些分散、独立、异构的城交通管理业务操作处理系统,提出大容量公路管理数据的有效管理方法,利用数据资源,充分挖掘信息潜力,提高公路管理水平与效率,降低管理成本。针对交通数据呈现的海量异构性等特点,提出了基于云计算服务的数据挖掘算法。云计算是一种基于互联网的、大众参与的计算模式,其计算资源(包括计算能力、存储能力、交互能力等)是动态、可伸缩、被虚拟化的,并以服务的方式提供。具体表现在:云计算的动态和可伸缩的计算能力为高效海量数据挖掘带来可能性;云计算环境下大众参与的群体智能为研究集群体智慧的新的数据挖掘方法研究提供了环境;云计算的服务化特征使面向大众的数据挖掘成为可能。同时,云计算发展也离不开数据挖掘的支持,以搜索为例,基于云计算的搜索包括网页存储、搜索处理和前端交互三大部分。数据挖掘在这几部分中都有广泛应用,例如网页存储中网页去重、搜索处理中网页排序和前端交互中的查询建议,其中每部分都需要数据挖掘技术的支持。因此,云计算为海量和复杂数据对象的数据挖掘提供了基础设施,为网络环境下面向大众的数据挖掘服务带来了机遇,同时也为数据挖掘研究提出了新的挑战性课题。
云计算数据挖掘服务主要有四个层次:底层为组成数据挖掘算法的基本步骤;第二层为单独的数据挖掘服务,例如分类、聚类等;第三层为分布式的数据挖掘模式,例如并行分类、聚合式机器学习等;第四层为之前三层元素构成的完整的数据挖掘应用。在此设计基础上,他们设计了基于云计算的数据挖掘开放服务框架,并开发了一系列的数据挖掘服务系统,例如Weka4WS、Knowledge Grid、Mobile Data Mining Services、Mining@home等,用户可以利用图形界面定义自己的数据挖掘工作流,然后在平台上执行。
此外,商业智能领域的各大公司也提供面向企业的大规模数据挖掘服务,例如微策略、IBM、Oracle等公司都拥有自己的基于云计算的数据挖掘服务平台。
1.5.11 高效视频编码技术
面向视频监控智能识别的需要、适合监控特点的高效率视频编码方法研究,在保证识别精度的情况下大幅度提高编码效率,大幅度降低传输和存储成本,并进行编解码软硬件开发和实现; 1.5.12 智能监控云平台技术
面向大规模联网监控应用,综合组织和调度计算、通信和存储资源,建立城域和广域监控云平台,支撑快速追踪等智能化应用。
1.5.13 海量视频存储需求
都昌县智慧安防体系中视频监控系统一般具有监控点多,摄像头数量多,保存时间长,监控数据的保存时间为30天。因此视频监控系统存储必须支持大容量,且容量具有高扩展性,满足长时间大容量视频图像存储的需求。
本系统在公安局、区县公安局、派出所等视频图像中心或视频图像信息前端汇聚平台,根据视频图像信息前端汇聚情况,配备视频图像信息存储设备,对其汇聚的视频图像信息资源进行录像;其他单位或个人,按照“谁建设,谁存储”的原则,配备视频图像信息存储设备,对其自建的视频图像信息资源进行录像。
视频信息存储技术标准:
1)每路视频图像信息的录像回放分辨率应不低于D1格式(704×576像素)。2)采用标准MPEG-
2、H.264格式进行编码,并能由VLC解码。3)保证以D1(720*576)的图像分辨率30天以上不间断存储。
4)对录像检索快速,具有完整的检索条件。支持多用户同时回放同一录像,对基于对象的智能检索有一定的扩展能力。
5)具有用户交友好的互界面,并可以剪取播放。具有按文件、按时间段下载录像的功能;
6)存储时间同步。数字图像存储设备应支持NTP。模拟图像存储设备的标定时间与北京标准时间的随机误差应≤10秒。7)具有根据时间、容量等条件实现自动清盘盘策略。8)提供可供二次开发的计算机软件SDK包和接口函数
9)当上级监控监控中心“宕机”时,下级监控中心具备5天的监时应及存储功能。当上级监控中心存储恢复正常后,存储自动转入上级监控中心存储,