基于卷积神经网络的道路风险目标检测模型探讨与推广

论文价格:0元/篇 论文用途:仅供参考 编辑:论文网 点击次数:0
论文字数:**** 论文编号:lw202329698 日期:2023-07-22 来源:论文网

本文是一篇软件工程论文,本文在对卷积神经网络每一层网络结构研究的基础上,完成了一个可重构卷积神经网络模型,主要解决数据集规模较小的问题。另外,除了可重构卷积神经网络使用层数较少以外,还采用了数据增强的方式与随机失活的方法相结合,即使网络层数相对较浅,但是,可以实现识别精度和识别效果较好。
第一章 绪论
1.1研究背景与意义
随着人工智能领域的发展,各类便捷化、智能化的设备已经广泛应用于人们日常的生产、生活当中,应用智能设备对道路风险目标检测的功能,给人们提供了各式各样的便利。AlphaGo战胜围棋高手的事情重新轰动了整个世界,卷积神经网络重新回归到人们的视野当中。并开始了对卷积神经网络的重新研究,以及将其应用在生产、生活等实际场景当中。
当前,人们生活当中的面部识别、刷脸支付、面部解锁等功能已经普及在大街小巷。而这种功能的本质就是基于卷积神经网络模型对图像当中目标主体的识别与判断,判断当前出现的目标是否为已经训练学习过的目标个体。从初段的对图片当中的手写字母、数字等简单字符的识别,到对于汉字、文章的识别,都是基于卷积神经网络对图片的识别作用。对于卷积神经网络的研究,随着这样的应用越来越流行,卷积神经网络模型的架构不断加深,各类提高精度的方法也应运而生。然而,这样形成的卷积神经网络模型所使用到的数据集都是在默认图像数据质量较好、提供的数据量充足的前提下完成的。但是,在实际生产应用当中,每一个不同个体的所能拍摄到的图像数据质量将差异明显。所以,为了贴合实际情景应用,所使用的数据应该更贴合真实效果。但是这样形成的数据集受到了拍摄时光照、背景、角度等各类问题的影响,使得数据集的规模本身较小。一般来说,训练卷积神经网络模型需要在大规模的数据的前提下,重新进行学习和训练。除此之外,可以较好的识别行驶道路上的目标的话,能够有效的提供对目标客体以及驾驶人的保护。因此,小规模数据集前提下的卷积神经网络的实现与应用就成为了研究当中的一个热点问题。
......................
1.2国内外研究现状
近几年来,随着深度学习技术的迅猛发展,国内外各类互联网公司以深度学习为载体,不断的发展深度学习在实际场景当中的应用。目前已经成型的应用已有很多,如:路牌识别、行人识别、车辆识别。
在上个世纪的研究当中,Walter Pitts[1]就已经提出建立一种模型,其中模型是以单个神经元作为参考而提出的一种逻辑形式。多层神经网络[2]的提出促进了深度学习的发展,纽约大学的LeCun[3]等人提出了多层卷积神经网络,并成功应用于手写数字识别,所提出的LeNet有较好的表现。与其他神经网络相比,卷积神经网络不但减轻了神经网络过拟合的问题,也降低了训练的难度。训练深层网络时,使用反向传播算法[4, 5],也能达到较好地理想效果。传统的目标检测算法大多采用滑动窗口的方式,如常用的特征描绘Haar(Haar Like,哈尔特征)[6],SIFT(Scale Invariant Feature Transform,尺度不变特征转换)[7],PCA-SIFT(Principal Component Analysis Scale-invariant feature transform,主成分分析尺度不变特征转换)[8],SURF(Speed Up Robust Features,加速版鲁棒特性特征算法)[9]等,对每类物体单独训练一个分类器。可见如果每类物体都有一个单独分类器的话,产生的代价较大。2001年,Viola和Jones[10]提出目标检测最具影响力的算法,实时处理检测目标的同时又具有较高的准确率,SURF算法使用AdaBoost(Adaptive Boosting,自适应增强算法)算法框架,采用滑动窗口实现有效的特征定位。Dalal等人使用SVM(Support Vector Machine, 支持向量机)[11, 12]作为分类器进行行人检测,以图像的梯度方向直方图作为特征。而上述提到的各类目标检测算法均是在训练数据集数量充足的前提下完成的,面对小数据量前提下的目标识别尚未得到较好的解决方法。
综上各类研究所述,随着人工智能时代的到来,以卷积神经网络为依托的各类实际应用已经愈发成熟,而这些应用的普及也是人工智能时代发展的必然趋势。所以,卷积神经网络方面的研究内容也就成了学术体系和各个互联网企业争相发展的热点。总结来说,目前对于数据量充足情况下的卷积神经网络训练与应用已经较为完善。但是,对于数据量明显小于常规训练要求情况下的卷积神经网络的训练,还存在着识别效果不佳、过拟合严重等问题。并且,如何能将卷积神经网络模型更好的应用于道路风险目标检测,这些问题仍值得继续在这方面进行更深层次的探索。
...........................
第二章 卷积神经网络及其理论基础
2.1卷积神经网络概述
当前,对于目标分类的方法有很多种,较为流行的是利用深度学习的知识进行目标识别。深度学习是一种利用卷积神经网络结构,对物体进行识别分类的方法。因为它成本低、速度快、识别效果好等特点,适用于应用在实际生产、生活场景当中。所以基于卷积神经网络的目标识别将成为未来的主流识别方式。而且,最近几年,围绕卷积神经网络结构的模型不仅仅应用在识别人脸,更应用在了实际汽车行驶过程当中,对道路中可能出现的风险目标进行检测识别。本节主要对卷积神经网络模型当中的一些重点结构进行详细阐述。


软件工程论文参考

2.1.1 卷积层
卷积神经网络模型中的卷积层,是卷积神经网络模型当中最基础也是最重要的一个结构。卷积层主要是由一系列预先规定规格的卷积核叠加而形成的。与输入图像进行卷积运算,得到特征图后,向下继续传递,用于之后的网络结构进行运算与学习。
卷积层[17, 18]的工作原理是:利用规定好规格的卷积核,在输入的图像上面进行滑动,遍历图像上的每一个像素点,而卷积核上的每一个权重数字,都由卷积神经网络模型在整个训练的过程当中进行不断地学习,最终将学习到的值赋给权重,形成一个完整的卷积核。这样的卷积核再与图像数据上的与卷积核规格匹配的像素块,进行卷积运算,得到相对应的输出。以此类推,卷积核将按照一定的规则,在横向和纵向分别与所有的像素点进行相同的运算,最终,形成该层的输出特征图。卷积运算如图2.1所示:
..................................
2.2基于卷积神经网络的目标检测算法
常见的用于目标检测的卷积神经网络结构有LeNet架构、ResNet残差网络、DenseNet卷积神经网络模型等。它们的卷积神经网络结构在层次上逐步加深,所用于训练的数据集规模也逐渐变大,在常见的大型数据集上的表现都较好,识别精度较高。本文将对它们的结构进行介绍。
2.2.1 LeNet
LeNet架构[22]是卷积神经网络模型当中最基础的一种,它面向的是针对手写数字的识别。总共包含了五层的基础网络层架构与全连接层混合搭建而成。其中包括:三个卷积层结构、两个最大池化层结构以及两个全连接层结构。全连接层作为最后输出的分类器。LeNet网络结构如图2.5所示:


软件工程论文怎么写

该卷积神经网络模型对所输入的图片的规格要求为32*32的尺寸,使用的卷积核的大小为5*5的结构。而最后一层全连接层将共有十个节点,分别对应着数字0到9。经过第一层卷积结构运算后,输出的特征图大小将变为28*28,然后输入到连接的最大池化层结构当中。最大池化层结构的步长为2,所以,输入的特征图的大小将全部变为原始的一半。再将14*14的特征图传入到下一个卷积层结构当中进行运算,特征图的大小将变为10*10,最大池化层将其最终变为5*5的大小。最后,在经历一个单独的卷积层结构,特征图变为1*1规格后,传入给全连接层,进行分类输出。
............................
第三章 基于可重构卷积神经网络的道路风险目标检测模型 ...........................15
3.1研究背景 ...............................................15
3.2可重构卷积神经网络模型 .......................................16
3.3基于可重构卷积神经网络的目标检测模型.........................19
第四章 基于VGG卷积神经网络的道路风险目标检测模型 ............................30
4.1研究背景 ..................................30
4.2VGG卷积神经网络 ...............................31
第五章 基于卷积神经网络的道路风险目标检测原型系统 ....................45
5.1系统框架设计 ..............................45
5.1.1 系统需求分析 ...............................45
5.1.2 系统架构 ........................46
第五章 基于卷积神经网络的道路风险目标检测原型系统
5.1系统框架设计
5.1.1 系统需求分析
本章主要设计并实现了一个基于卷积神经网络的道路风险目标检测原型系统,系统通过批量选择、输入不同的当前需要进行识别的数据,进行识别分类,然后再将识别结果输出给用户端的可视化界面,从而完成了整个识别过程。该原型系统主要的需求如下:
(1) 功能设计:本系统是在调用已经训练完成后的卷积神经网络模型的条件下进行的,需要摄像头对当前目标进行拍照,并进行选择上传到原型系统当中。本文建立了两个不同的卷积神经网络模型,所以,在原型系统当中,需要可以更换不同的卷积神经网络模型,用于提供给用户选择识别。其次,考虑到用于识别的图像具有较好的质量,所以经过识别后的图像也将私密保存到本地,以供日后进行训练学习。
(2) 性能评估:模型实验在对于目标识别和判断的过程当中存在着识别的误差,识别精度的大小是评价一个模型好坏的重要条件。除此之外,相比于训练过程当中的过拟合情况以及损失情况,模型在实际情况中过拟合与损失情况的表现也就是另一个重要指标。
(3) 环境需求:本文所搭建的卷积神经网络模型需要在Python 3.6的条件下运行,主要使用了本地主机、对卷积神经网络进行训练,以及其中调用了若干与Keras架构为基础的协议函数。使用过程当中,以本地服务器基础,实现了基于网页界面的用户端。以及实现了一种基于Linux的,Jetson Nano移动端
(4) 可视化用户端设计:本文所建立的原型系统考虑到用户在实际使用的过程当中的简洁性,所以将所有的函数及构建过程进行封装,展现一个简洁的、友好的用户端界面供用户选择。用户可以简便的进行自主更换用于识别的卷积神经网络模型,也可根据实际需要,自主选择需要识别的图片数据。并且,利用了移动端Jetson Nano,实现了将道路风险目标检测系统的实体化。
..............................
第六章 总结与展望
6.1论文总结
随着人工智能技术的发展,基于卷积神经网络的各类智能设备使用前景将更加广泛。对图像的处理以及识别将更加成熟,并且将其应用到更广泛的实际生产场景当中。然而,实际生产、生活情景当中,由于卷积神经网络对用于训练学习的数据集的图片要求质量较高、数量较多,这些因素都将最终影响卷积神经网络的识别效果和效率。本文通过对传统卷积神经网络研究的基础上,提出了可重构卷积神经网络模型与VGG-16复用模型,使得卷积神经网络更加具有实用价值。主要工作由三部分组成:
首先,由于数据集在形成的过程当中,每一张照片中不同的个体所处的环境大不相同。并且,所处的环境下的每一个个体当前位置的背景内容、拍摄角度、拍照光线等条件,都将影响卷积神经网络在学习图像主体目标时,产生特征提取困难、特征提取不准确等问题。因此,最终能实际应用于训练卷积神经网络的数据集相对较小。针对这样的问题,本文在对卷积神经网络每一层网络结构研究的基础上,完成了一个可重构卷积神经网络模型,主要解决数据集规模较小的问题。另外,除了可重构卷积神经网络使用层数较少以外,还采用了数据增强的方式与随机失活的方法相结合,即使网络层数相对较浅,但是,可以实现识别精度和识别效果较好。
其次,针对传统卷积神经网络模型来说,由于其规模较大以及受过大规模数据集训练,所以,面对小规模数据量时在道路风险目标识别应用中识别精度不够高。针对此问题,本文重新移植复用了VGG-16卷积神经网络模型,将其浅层网络进行复用。因为它们学习过具有相对共性的特征,可以重新复用。然后,将靠后的网络层重新编写,配合本文的数据集进行重新训练,得到了新的VGG-16复用卷积神经网络模型。以保证改进后的卷积神经网络模型可以在小规模数据量的前提下,仍有较好的识别精度的表现。
最后,在上述提出的两种卷积神经网络的基础上,本文进行了原型系统的设计与实现。分析了原型系统实际应用时的硬件条件和软件环境,并将上述两种卷积神经网络分别应用到原型系统当中,并给出了最终的系统测试结果和分析。
参考文献(略)

如果您有论文相关需求,可以通过下面的方式联系我们
客服微信:371975100
QQ 909091757 微信 371975100