本文是一篇机械论文,本研究搜集分析了现有的两款国内交通标志数据集,即CCTSDB数据集和TT-100K数据集,最终选择了TT-100K数据集作为本研究的原始数据集。
第一章 绪论
1.1 课题研究背景及意义
人工智能作为第四次工业革命的关键领域之一,近年来受到世界各国尤其是发达国家和地区的大力推动和发展,以实现在未来的产业革命中占得先机甚至技术垄断的目的。2017年7月,国务院发布实施了《新一代人工智能发展规划》[1]等文件,这成为了近些年我国人工智能产业发展的框架和行动指南,并成功推动了我国人工智能产业在一定先发优势基础上加速发展。
得益于对人工智能的研究浪潮推动,近年来,计算机视觉技术在深度学习理论发展和硬件算力飞速提升的支持下也取得了重大突破。而同时我国的国民生活水平和国家基建实力取得了跨越式发展,现在道路交通网非常发达且还在不断健全,而人民私家车保有量几十年来稳步上升,并有望于2021年超越美国成为世界第一[2]。发达的交通网加上规模庞大的私家车数量,使道路上的交通情况愈发复杂,导致我国交通事故发生率和死亡率在全球都居高不下[3],表1.1为2013年至2018年我国交通事故统计。
机械论文怎么写
................................
1.2 国内外研究现状
TSR是从实际道路场景中确定交通标志目标的所在位置及大小,并判断出该目标的类别。早期交通标志检测识别基于传统目标检测算法,存在着诸多不足[8],且由于满足不了实际需求而被逐渐放弃。近年来随着人工智能的爆炸式发展,主流的交通标志检测识别已换为基于深度学习,且随着深度学习理论的不断创新,作为其重要应用场合之一的交通标志检测与识别得到了国内外众多优秀学者的研究,并接连取得突破性成果。
1.2.1 目标检测研究现状
传统目标检测算法是先输入图像,然后依据手工设计的特征进行特征提取,再使用分类器对检测到的目标进行分类,最后输出分类结果。但由于不同情况下手工特征设计与提取的难度不同,导致其有一定局限性。其进行特征提取的方法有David lowe提出的SIFT(Scale-invariant feature transform)尺度不变特征变换[9]、Navneet Dalal和BillTriggs提出HOG(Histogram of Oriented Gradient)方向梯度直方图[10]和Felzenszwalb提出的DPM(DeformablePart Model)可变性组件模型[11]。DPM在三者中是较为成功的方法,也可说是HOG的改良版,相较于前两种具有更强的鲁棒性。虽然DPM的检测性能被后期的众多网络超越,但它的许多思路如滑动窗口等被后期众多网络所借鉴,具有较为深远的影响。
基于深度学习的目标检测算法在2012年后得到重大发展。Alex Krizhevsky[12]等人提出并使用AlexNet网络在ImageNet[13]图像分类比赛中夺冠,揭开了深度学习算法统治目标检测领域的序幕。后来基于深度学习目标检测算法发展为了两分支:一是基于区域提取的二阶段算法,主要有Ross Girshick等人提出的R-CNN[14] (Regions with CNN features)和Fast R-CNN [15] (Fast Regions with CNN features),S.Ren等提出的Faster R-CNN [16] (Faster Regions with CNN features)等。Faster R-CNN是前两者的改良版,其利用RPN(Regon Proposal Network)即区域生成网络进行候选区域产生,以替换前代的滑动窗口和遍历搜索方法,提升了算法性能。二是基于回归的单阶段算法,主要有R.Joseph等提出的YOLO[17] (You Only Look Once)系列算法和W.Liu等提出的SSD[18] (single Shot MultiBox Detector)算法。单阶段算法比双阶段算法有更快的检测速度,但检测精度略有逊色。
..................................
第二章 目标检测算法相关理论
2.1 深度学习理论基础
深度学习源于人们对人工神经网络的研究,其本质是利用一些数学模型对人脑活动进行模拟研究,而模拟的数学模型也叫做神经网络[30](Neural Networks,NN)。卷积神经网络[31](Convolutional Neural Networks,CNN)是神经网络的一种,其多用于图像处理分析,其可整合图像数据的底层较浅语义特征为高层丰富语义特征,使图像样本可供于学习的内在信息增多。在对图像进行分析处理时,卷积神经网络具有极大的优势。
2.1.1人工神经网络
生物神经系统的构造是联合无数个神经元,并由神经元进行信息的传递和交流。人工神经网络是对生物神经网络进行模仿研究而成,其基本单元也为“神经元”,其基本结构如图2.1所示,1 2[,,]nX =x x Kx为输入向量,1 2,,nx x Kx为每个神经元的输入值,b为偏置变量,1 2,,nW W KW为每个神经元对应的权重值,每个神经元的输入值与其对应的权重值相乘后再与偏置相加,然后利用非线性函数f(x)将值进行非线性变换。最终神经元输出为F(x),且()()TF x =f W X +b[32],其中f(x)也称为激活函数。
通过引入非线性函数f(x)用作激活函数模型来进行非线性变换,可使网络信息存储能力及模型的表达力增强,进而使深层神经网络可逼近任意函数。常见的激活函数类型包括Sigmoid[33]函数、Tanh函数和ReLU[34]函数等。
机械论文参考
...........................
2.2 目标检测算法相关理论
目标检测技术作为计算机视觉中算法实用性很强的方向之一,已广泛应用于众多实际生活领域,如自动驾驶汽车、人脸定位和识别、自动化工业生产线和机器人导航等领域。回顾目标检测与识别算法的发展历程,可分为传统基于视觉特征和图像处理的检测与识别方法,基于深度学习的单阶段(one-stage)目标检测与识别算法和双阶段(two-stage)目标检测与识别算法。
2.2.1传统目标检测算法
传统目标检测方法的检测流程可分为三步:①候选区域产生。一般采用不同大小、长宽比的滑动窗口对输入图像进行遍历,此类方法效率低下,会导致冗余窗口过多;②特征提取。使用手工设计的特征对候选区域进行特征提取,但目标种类过多、环境条件变化、目标背景复杂等会导致特征提取鲁棒性变差;③分类。使用已经训练好分类器如SVM、Ada Boost[39]等对提取的特征进行分类。
随着目标检测技术实际应用范围的不断扩展,传统目标检测出现诸多限制和缺点,如检测速度慢,算法复杂等。为满足不断提高的应用需求,便出现了基于深度学习的目标检测与识别方法,其相比传统目标检测方法有着更为强大的特征提取能力,且算法复杂度有所降低,是目前目标检测技术中的主流方法。
...........................
第三章 交通标志数据集准备及预处理 ............................. 21
3.1 中国道路交通标志介绍 ............................. 21
3.2 中国交通标志数据集 .......................... 22
第四章 交通标志小目标检测方法改进 ............................... 32
4.1 改进多尺度预测 ............................. 32
4.2 增强感受野 ................................. 34
第五章 实验设计与结果分析 ............................. 45
5.1 实验环境及平台搭建 .................... 45
5.2 目标检测效果评价标准 ............................ 46
第五章 实验设计与结果分析
5.1 实验环境及平台搭建
本文基于深度学习的目标检测网络训练及检测均在Windows10操作系统下完成,考虑到CPU计算速度不能满足网络模型的训练要求,本实验平台另外搭载了双显卡Geforce RTX 2080 Ti (11G),详细设备环境参数如下表5.1所示。
机械论文参考
其中CUDA是Nvidia创造的GPU运算平台,可为深度学习过程提供矩阵运算的加速支持,搭配与CUDA版本匹配的cuDNN可实现GPU加速运算。原始YOLOv4采用Darknet作为深度学习框架,本文为了方便网络训练过程可视化及后续数据分析,我们采用了Pytorch作为深度学习平台,并使用YOLOv4的Pytorch版代码进行学习。
Pytorch是torch的一个版本,而torch是目前在机器学习等领域被广泛应用的一款计算框架,由Facebook的人工智能研究院研究开发。相比于Caffe、Tensorflow等其他框架,Pytorch较为简洁易行,使初学者上手较为容易,且运算速度等表现也较为出色。
...........................
第六章 总结与展望
6.1 全文总结
提升交通标志小目标实时检测识别的精度和速率是推进智能交通系统完善和降低交通事故发生率的重要环节,针对现阶段缺乏完善的交通标志小目标数据集、小目标检测识别难度大以及检测速度与精度不能兼顾等问题,本文通过扩建数据集、优化基础算法和效果对比分析,最终得到了一系列成果:
(1)搜集分析了现有的两款国内交通标志数据集,即CCTSDB数据集和TT-100K数据集,最终选择了TT-100K数据集作为本研究的原始数据集。针对原始数据集所含类别的数量分布极不均衡这一缺点,采用了数据补充和结合交通标志特点改进的Mosaic、Cutmix数据增强使其达到了较为均衡的类别数量分布,然后进行了数据集标注和修改,以使其适用于本研究。最终得到了一个规模较大,质量较高的针对中国交通标志小目标的数据集,完成了对交通标志小目标数据集的扩建。最后通过对比测试实验验证了所做数据集均衡化处理的有效性,所研究35类交通标志的mAP由86.49%提升到了88.12%。
(2)阐述卷积神经网络基本结构、深度学习基础理论和主流基于深度学习目标检测识别算法,再结合检测效果对比分析了各种基于深度学习算法,最终选择效果最佳的YOLOv4算法作为本研究的基础算法。针对交通标志小目标检测精度偏低,对基础算法进行了多尺度预测结构调整以使浅层特征更充分地被网络利用获取更多图像位置、细节信息。并为减少细节信息丢失和增强语义特征信息,采用基于空洞卷积的ASPP特征提取模块替换基础算法的SPP模块。减少细节信息丢失和增强语义特征信息后为使多尺度特征融合更为有效,对特征融合策略进行了改进,由PANet变为PANet+ASFF,以解决不同尺度特征之间不一致问题。对数据集采用k-means++聚类修改锚点框尺寸,以进一步提升检测精度。最后通过对比测试实验验证了所做基础算法改进的有效性,35类交通标志的mAP有了较大提升,由88.12%变为92.93%
参考文献(略)