基于运动检测的安防系统研究与设计
开题报告
目 录
一、选题背景
二、研究目的和意义
三、本文研究涉及的主要理论
四、本文研究的主要内容及研究框架
(一)本文研究的主要内容
(二)本文研究框架
五、写作提纲
六、本文研究进展
七、目前已经阅读的文献
一、选题背景
视频安防自诞生起,经历了两次革命性的发展[1]。第一次发展是自 20 世纪 70 年代的基于模拟信号传输的视频监控发展到 20 世纪 90 年代的数字视频监控[2]。这次革新将信号由模拟信号转换成数字信号。数字信号经过编码压缩存储在 PC 端,有效解决了存储介质及存储周期的局限性问题。第二次革新始于 2005 年,随着网络技术与资源的发展和成熟以及云计算等技术的出现,使得网络视频监控技术应用更加广泛普遍[3]。目前使用网络视频监控已成为国内安防行业的标配。早期的视频监控是基于模拟信号传输并以 PC 机对矩阵主机切换和多媒体管理的系统。这是第一代的视频监控系统,其主要标志为通过模拟信号传输视频信息。随着微型处理器在功能上的进步与价格上的降低,第一代视频监控系统的组成更加灵活通用。其技术的接口标准也更加规范,形成了较为友好的人机界面。但由于承载视频信号仍为模拟信号,因此存在许多局限性[4]如下:1)模拟信号传输距离有限且占用带宽较大,只适用于小范围区域的监控;2)系统的结构单一,扩展能力较低;3)各部分独立运作,相互之间无法进行联动;4)硬件成本高,操作繁琐,人机交互较差;基于第一代监控系统的发展瓶颈受制于模拟信号上的不足,第二代视频监控系统则采用了数字信号作为视频流的传输信号。将视频图像利用数字压缩技术如 MPEG、H.263等完全数字化。数字化的监控系统取代了第一代视频监控系统的视频监控模式[5],即以摄像头、矩阵分割器为核心的模拟视频监控模式。
数字化后的视频监控系统可以对数字信号进行各种计算机图像处理、多信息融合、系统扩展性大大增强等优势,其特点如下:1)数字视频信息存储空间更少,数据检索方便,稳定性更高;2)数字信号抗干扰能力强,远距离传输信号衰减影响较小;3)系统扩展性高,可以进行多模块信息共享、融合;借助了近年来高速发展的互联网技术,各行业都进行了颠覆式的发展与转变。视频监控领域也迎来的第三代视频监控系统[5],该系统利用了互联网、云计算、大数据等技术形成了更加强大的监控系统,监控视频内部植入了 Web 服务器,可以通过远程访问摄像头,整个系统特点如下:1)简便性,只要通过以太网接入网络,就能利用现有局域网基础设施进行监控系统的布局;2)全面远程监控,监控不再受制于距离。可以任意访问系统中布置在任何地理位置的监控信息;3)更多的扩展。接入互联网后可进行更多的信息处理、融合、拓展等利用云计算、大数据等技术可组成更强大、复杂的监控网络系统;4)性能稳定可靠,系统维护方便;视频监控系统发展到第三代具备了更加广泛的应用、更低的成本、更容易实现的解决方案,因此得到了各界的重视,比如军事基地、机场、军械库、银行等安全级别较高的场所与车站、商场等人流量较大的场所还有高速公路,十字路口等智慧交通的应用[7]。但是仅仅提高视频监控的视频质量(高清、夜间清晰)还只是属于信息获取,对于监控的防御的要求,还是基于认为的判断,这就造成以下的不足:1)监控人员长时间工作容易引发视觉疲劳与损伤,不仅影响健康也容易漏检重要信息。有研究证明,人的注意力只能够坚持 20 分钟,超过 20 分钟后,人的注意力只能够注意 10%的信息[6]。因此现有监控系统满足实时的防御还是有很大困难的。2)视频监控不具主动防御性。摄像头作为监控系统的主要工具,除了作为捕获视频信息的工具,还能作为一种威慑工具表明该场景在监控之中。但以上两种功能都不能够在危害发生之前采取有效措施避免灾害的发生,不能作为主动防御的手段,达不到“实时监控,即时反映”的目标。3)信息提取能力不高。当灾害发生后,寻找证据的成本也是非常大的一部分。在长时间的大量视频信息中寻找关键的几帧有效信息同样需要相当长时间的高度的注意力集中才能完成。在安防系统中,视频监控具备了恶劣环境监控、全天候工作、远程、联动监控等功能,但其实时、主动防御功能还有很大的技术空白。有研究表明,在大多数犯罪、破坏行动发生前都有一定的动作预兆,在犯罪发生的时间分布也存在着非常明显的规律[7]。因此视频安防系统应该具备这种决策功能辅助人们做判断。所以,视频监控的“智能化”是必然趋势。
二、研究目的和意义
随着计算机技术的高速发展及硬件成本的降低,越来越多的智能设备走进了老百姓的生活的方方面面[8]。在视频监控领域也迎来了智能化浪潮。传统的视频监控系统需要大量的人力资源去进行人为的分析判断,长时间的工作对工作人员的视力造成损伤且容易导致疲劳引起的重要信息遗漏[9]。于是,人们开始将机器视觉技术引入到监控安防领域,使监控更具自动化与智能化。即不需要人为操作与判断,即可通过分析视频检测与识别运动目标,并可通过定制不同的方案采取进一步的分析与操作。视频监控广泛应用于银行、交通、停车场、办公楼等场合的安防系统[10],但是大多数监控系统仍需要人力观察与判断,在出现紧急情况时,一般都是利用录像功能回放查看。并不能承担起主动监督的作用。对于安防系统来说,安全防卫功能是最核心的内容,而视频监控只能起到监视的作用,并不能起到主动防御的作用。而智能的视频安防系统可以承担起全时段实时智能监控,在获取到的图像序列进行智能分析。例如在银行、商场等场所智能分析视频中是否存在可以运动目标并及时提醒人员注意,在车站或者机场等人流量较大的场合,可以监测判断是否有可疑物遗留等。这些是传统的视频监控所不能实现的功能,通过运动目标监测的视频安防可以有效的在危险发生前做到主动防御,并能够节省大量的人力物力财力。发生与 2013 年的波士顿马拉松爆炸案的侦破即利用了智能视频分析技术[11]。爆炸案发生后,警方呼吁民众提供任何与爆炸案相关的图像或视频信息,并利用智能视频分析技术,对民众提供的视频信息以及社交网络上海量的视频片段进行分析与调查。在很短的时间内,就确定了案件相关的线索与证据。智能监控[12]是一个总体框架,包含了多个不同的计算机视觉任务,从图像序列检测,跟踪,分类感兴趣的对象,并接下来理解和描述这些对象的行为。设计智能视觉监控系统的最终目标是取代现有的被动监测,消除或者至少尽量减少人们监测和分析的可视化数据的需求。智能视频安防系统[13]作为一个整体系统,包含了许多图像处理与模式识别技术,包括图像增强,图像视频降噪,运动目标检测,形态学处理,轮廓标记等。智能视频安防系统的设计目标即解决传统视频监控不能做到“防患于未然”的缺陷。使安防系统更加智能、安全、可靠。
三、本文研究涉及的主要理论
2006 年 IBM 公司宣布已开发一款名为“智能监控系统”的视频安防软件[18],用于实时监控并分析视频系统数据。该系统利用了网络技术,将布置于各个监控场景下的网络摄像头通过网络实时传递到安防系统中进行监控,并且可以及时发现监控场景下的潜在危险信息。英国雷丁大学的 VIEWS 项目组对安防系统中的危险识别技术进行了研究[19],该项目组对车辆和行人的跟踪以及交互与识别技术展开了研究,该项技术应用于安防系统中的预警功能,例如在机场和地铁站的恐怖活动进行识别和警报。英国雷丁大学的 VIEWS 项目组对安防系统中的危险识别技术进行了研究,该项目组对车辆和行人的跟踪以及交互与识别技术展开了研究。该项技术应用于安防系统中的预警功能,例如在机场和地铁站的恐怖活动进行识别和警报。国内的智能安防系统行业起步较晚,但由于近年来民众对于公共场所下的安防意识的提高,国内智能安防行业得到了高速发展。在智能安防系统研究领域,中科院自动化研究所在国家支持的973、863百人计划等重大课题下开发更为先进的智能化安防技术。公安部提出了 3111 工程,旨在建设更安全的城市管理与更智能的交通管理。国内安防厂商领军企业如海康威视、大华股份等在安防监控产品与技术上都取得了较好的成绩,其中海康威视入选全球安防监控行业十大品牌,位列第四位。前三位分别是美国的霍尼韦尔、德国博世、法国赛峰。目前海康威视与德州仪器(TI)进行了深度的合作,借助TI 在数字信号处理器和视频解码器领域的技术以及完整的视频安全解决方案,海监控产品将更加全面与成熟。2014 年 12 月份,国内手机厂商小米公司推出了轻量化的家居安防系统“小蚁”智能摄像头。该摄像头可以检测其摄像范围的目标运动,当场景中出现较大范围的运动时,摄像头将会将该段视频信息压缩后推送到用户手机上进行查看。另外用户可以随时利用手机进行时实时查看。该产品作为一个轻量级的监控产品,属于智能家居范畴,应用于家庭的安全防护。例如将摄像头对准家中门窗等,当长时间外出时,该产品就可全时段安全防护,一旦出现门窗有异常(如门把手扭动,门窗被打开,闯入等)就可立即通过网络将警报信息传到主人手机,及时获得信息并进行下一步决策。综上所述,视频监控还有着非常广的市场,特别是互联网技术对各产业进行颠覆式革命的时代,相比于清晰度更高,续航能力更持久来说,更智能才能符合人们的真实需求。而使视频监控具备智能的基础则是计算机视觉、图像处理、模式识别技术的融合,其中运动检测技术是其中最为关键的环节。
光流[20]是空间运动物体在观测成像面上的像素运动的瞬时速度。光流的研究是利用图像序列中的像素强度数据的时域变化和相关性来确定各自像素位置的运动,即研究图像灰度在时间上的变化与景象中物体结构及其运动的关系。将二维图像平面特定坐标点上的灰度瞬时变化率定义为光流矢量。如果图像中没有运动目标存在,那么运动矢量表现在图像区域的变化是连续的。当场景中出现运动物体时,与整体背景之前会存在相对运动,换言之,运动物体的运动矢量与周围背景的运动矢量不同,因此可以判断出运动物体的位置。光流法的优点是可以在摄像机运动的情况下检测运动目标,且可以精确的获得运动目标的速度。该算法的缺点是计算量较大,不能使用与实时的目标监控。另外就是如果检测环境下的噪声会严重影响算法性能。
四、本文研究的主要内容及研究框架
(一)本文研究的主要内容
本文主要研究的视频安防系统中的运动目标检测与视频去噪技术,并实现了一种基于运动检测的视频安防系统。本论文主要分为六个章节。第一章为绪论,主要阐述了视频安防课题的研究背景与意义,以及国内外对于该课题的研究成果和现状。第二章为视频安防系统的需求分析。第三章为视频降噪模块的研究与设计。主要研究了双边滤波算法的优缺点并通过大量实验与研究对其进行了自适应的改进。第四章研究了运动目标检测算法,根据需求实现了基于平均背景模型的运动检测与混合高斯模型的运动检测。并通过两个测试序列对两种算法进行分析比较并根据实际的监控环境提出了一种新的建模方法。第五章为系统整体设计和软件设计。第六章对本文的研究工作进行了总结,分析了本文所实现的视频安防系统的不足之处,并对系统的改进行了展望。
(二)本文研究框架
本文研究框架可简单表示为:
五、写作提纲
摘要 5-6
ABSTRACT 6
第1章 绪论 9-15
1.1 研究背景与意义 9-11
1.2 国内外研究现状 11-14
1.3 论文的主要研究内容 14-15
第2章 智能视频安防系统需求与设计 15-20
2.1 智能安防系统的需求 15-16
2.2 智能安防系统的设计 16-18
2.3 系统的性能评估 18-19
2.4 本章小结 19-20
第3章 视频降噪模块研究与设计 20-31
3.1 现有降噪算法分析 20-23
3.2 改进的双边滤波算法 23-28
3.3 实验结果分析与比较 28-30
3.4 本章小结 30-31
第4章 运动检测模块研究与设计 31-46
4.1 现有运动检测算法分析与比较 31-36
4.2 平均背景模型研究 36-37
4.3 高斯模型分析研究 37-41
4.4 本系统的运动目标检测算法选择 41-45
4.5 本章小结 45-46
第5章 视频安防系统设计 46-56
5.1 开发平台的选择 46-47
5.2 系统的功能概述 47-49
5.3 智能监控系统结构说明 49-54
5.4 实验结果 54-55
5.5 本章小结 55-56
第6章 总结与展望 56-57
6.1 研究工作总结 56
6.2 不足与展望 56-57
参考文献 57-60
六、本文研究进展(略)
七、目前已经阅读的主要文献
[1] 骆云志, 刘治红. 视频监控技术发展综述[J]. 兵工自动化, 2009, (1):1-3.
[2] 刘富强, 卢赤班. 数字视频监控系统及其应用[J]. 工矿自动化, 2003 (3): 31-33.
[3] Vezzani R, Cucchiara R. Video surveillance online repository (visor): an integratedframework[J]. Multimedia Tools and Applications, 2010, 50(2): 359-380.
[4] 何遥. 高清视频监控的多种传输模式[J]. 中国公共安全: 学术版, 2014, (14).
[5] 郝荣霞, 徐旭东, 陈文博. 基于网络摄像机的第三代视频监控系统的研究[J]. 信息技术, 2005, (9): 120-122.
[6] 陈梦泽. 人类视觉注意力的发展与分析[J]. 吉林省教育学院学报旬刊, 2012, (12):139-140.
[7] 陆娟, 汤国安, 蒋平等. 基于卡方检验的犯罪时间分布特征分析[J]. 警察技术, 2012,(4).
[8] 石延辉, 李澍森, 左文霞等. 智能设备的发展现状分析及前景展望[J]. 电气开关,2010, 48(4). DOI:10.3969/j.issn.1004-289X.2010.04.004.
[9] 权志昌, 廖海玲, 杨平等. 荧屏作业人员视疲劳研究[J]. 眼外伤职业眼病杂志: 附眼科手术, 1990.
[10]Lipton A, Kanade T, Fujiyoshi H, et al. A system for video surveillance and monitoring[M]. Pittsburg: Carnegie Mellon University, the Robotics Institute, 2000.
[11]张勤林, 林慧卿. 美国波士顿马拉松爆炸案处置经历[J]. 轻兵器, 2013, (24).
[12]孙冬青. 综合智能监控系统概述[J]. 电视技术, 2012, (8).
[13]蔡业飞. 智能安防:给城市一个智慧的“大脑”[J]. 中国公共安全: 学术版, 2012, (1).
[14]Collins L, Kanade F, Duggins T, et al. Hasegawa. A system for video surveillance andmonitoring: Vsam final report[R]. Technical Report CMU-RI-TR-00-12, RoboticsInstitute, Carnegie Mellon University, 2000.
[15]Haritaoglu I, Harwood D, Davis L S. W4: Real-time surveillance of people and theiractivities[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2000.
[16]Wren C R, Azarbayejani A, Darrell T, et al. Pfinder: Real-time tracking of the humanbody[J]. Pattern Analysis and Machine Intelligence, IEEE Transactions on, 1997, 19(7):780-785.
[17]Bobick A F, Intille S S, Davis J W, et al. The KidsRoom: A perceptually-based interactiveand immersive story environment[J]. Presence: Teleoperators and Virtual Environments,1999, 8(4): 369-393.
[18]Shu C F, Hampapur A, Lu M, et al. Ibm smart surveillance system (s3): a open andextensible framework for event based surveillance[C].Advanced Video and Signal BasedSurveillance, 2005. AVSS 2005. IEEE Conference on. IEEE, 2005: 318-323.
[19]Remagnino P, Tan T, Baker K. Multi-agent visual surveillance of dynamic scenes[J].Image and Vision Computing, 1998, 16(8): 529-532.
[20]Beauchemin S S, Barron J L. The computation of optical flow[J]. ACM ComputingSurveys (CSUR), 1995, 27(3): 433-466.
[21]陈凤东, 洪炳镕. 基于动态阈值背景差分算法的目标检测方法[J]. 哈尔滨工业大学学报, 2005, 37(7): 883-884.
[22]Stauffer C, Grimson W. Adaptive Background Mixture Models for Real-timeTracking[C].Proceedings of IEEE conference on Computer Vision and PatternRecognition, FortCollins, Colorado, USAE Press, 1999: 246-252.
[23]Lou.IEEE Transactions on Pattern Analysis and Machine Intelligence, 2005, 27(5):827-832.
[24]BP L. The Analysis of Background Subtraction Techniques Using Gaussian MixtureModels[C]. IEEE International Conference on Acoustics Speech and Signal Processing,Dallas, USA, 2010: 4042-4045.
[25]齐玉娟, 王延江, 李永平. 基于记忆的混合高斯背景建模[J]. 自动化学报 ISTIC EIPKU, 2010, 36(11). DOI:10.3724/SP.J.1004.2010.01520.
[26]杨丽娟, 刘教民, 王震洲等. 像运动检测报, 2006, (1): 89-92.
[27]Mor Image Analysis for Lit al., Eds. (2008) [Book Reviews][J]. Engineering in Medicineand Biology Magazine, 2010, (1):106-107.
[28]邱道尹, 张文静, 顾波, 等. 帧差法在运动目标实时跟踪中的应用[J]. 华北水利水电学院学报, 2009 (3): 45-46.
[29]贾云得. 机器视觉[M]. 科学出版社, 2000.
[30]Babaud J, Witkin A P, Baudin M, et al. Uniqueness of the Gaussian kernel for scale-spacefiltering[J]. Pattern Analysis and Machine Intelligence IEEE Transactionson, 1986 (1): 26-33.
[31]Tomasi C, Manduchi R. Bilateral filtering for gray and color images[C]//Computer Vision,1998. Sixth International Conference on. IEEE, 1998: 839-846.
[32]Paris S, Kornprobst P, Tumblin J, et al. A gentle introduction to bilateral filtering and its applications[C]//ACM SIGGRAPH 2007 courses. ACM, 2007: 1.