基于深度卷积神经网络的遥感图像目标检测软件工程分析

论文价格:0元/篇 论文用途:仅供参考 编辑:论文网 点击次数:0
论文字数:**** 论文编号:lw202329865 日期:2023-07-22 来源:论文网
本文是一篇软件工程论文研究,本文针对遥感图像中目标尺度变化范围大,小目标众多以及有些目标处于遮挡或复杂背景等情况下导致现有深度学习方法的误检及漏检率仍然较高问题,进行了详细研究并提出了基于深度卷积神经网络的目标检测方法,大量的对比试验以及消融实验证明了本文方法的有效性,本文的总结如下:第一,本文提出了一种基于多成分融合的深度卷积神经网络模型来提升遥感图像目标检测精度,首先设计了双向金字塔融合网络作为特征提取的主干网络,该网络在各个尺度特征图中引入卷积和反卷积操作以获取相同深度下不同尺度的特征图,进而通过拼接操作融合不同深度下相同尺度的特征图,有效地改善了深度卷积神经网络随着深度的加深而空间信息逐渐缺失的局限性,提高了遥感图像中小目标的特征提取能力。然后提出了相对区域推荐网络,该网络根据相对交并比的大小,最大化地学习小目标的特征和大目标的局部特征,并得到初步检测结果。最后通过上下文信息网络对相对区域推荐网络得到的初步结果强关联的背景信息的学习,提升复杂背景下检测结果的同时得到了更加优化分类和定位结果。通过对比和消融实验证明了本模型在检测遥感图像中的小尺度目标甚至是处于遮挡或复杂背景中目标时有良好表现。

1 绪论

1.1 课题背景及研究意义
遥感技术是通过卫星或无人机等远距离观测设备测量并收集一定区域内地形地貌等物理特征信息的技术,研究人员通过进一步处理获取到的信息,可以更好地感知地球事物。遥感图像是遥感信息的重要组成部分,具备获取速度快,范围广,分辨率高而且包含丰富的地物信息等优点,是目标检测,变化检测,地物分类等任务的主要数据来源。近年来,随着遥感成像技术的迅速发展,其逐渐从军事领域发展到民用领域,高质量以及大规模的遥感数据正越来越多地进入人们的视野,并在军事侦察,地形勘测,农林建设,抗震救灾等方面发挥着越来越重要的作用。
随着智能设备和技术的迅猛发展,大量的图像和视频数据充斥着人们的日常生活,这使得人们对数字图像处理技术的研究越来越迫切,而目标检测技术是图像处理领域中最重要的研究内容,其任务是从图像中的众多物体中挑选出感兴趣的目标,并通过位置和类别信息确定地描述这一目标,它是解决语义分割,目标跟踪,场景理解等更高级计算机视觉问题的基础,是信息安全,视频监控,自动驾驶,图像检索,医学图像分析,网络数据挖掘,无人机导航,混合现实等领域的关键技术。

近年来遥感影像技术获得了长足进步,国际上所广泛使用的谷歌地球,国内的吉林一号卫星代表了当前遥感技术的最高水平,其搭载了高分辨率图像传感器,使人们可以轻松地获取高质量的遥感图像,从而为目标检测技术的研究提供了很好的研究素材。相比于自然图像,遥感图像中目标的背景复杂,目标尺度大小分布不平衡且小目标居多,甚至有些目标由于成像或遮挡等原因只有部分裸露在视野中。如图 1.1 所示,(a)中目标处于复杂的背景下边缘颜色和纹理特征不明显,不易检测。(b)中目标只有部分裸露在视野中,特征较少不易检测。这使得遥感图像的目标检测问题仍然面临严峻的挑战。

......................

1.2 国内外研究现状
目标检测是图像处理领域的重要研究内容,有着强大的理论支撑和很高实际应用价值,是国内外专家学者广泛关注的研究课题,由于传统的目标检测方法已经很难满足人们处理复杂的大规模遥感数据的需求,而基于深度卷积神经网络的方法凭借其精巧的设计结构,只需要较少的参数就可以提取到更加丰富的本质特征,从而有效地的加快了检测速度,提升了检测精度。因此,将基于深度卷积神经网络模型应用于遥感图像的目标检测是大势所趋。

AlexNet 是 Krizhevsky 等人[1]最早提出的卷积神经网络模型,该模型在只使用了 5个卷积层和有限的卷积操作的前提下就拿下了 2012 年 ImageNet 竞赛图片分类的冠军,是后来卷积神经网络发展的雏形。在这之后,GoogleNet[2]网络在不加大参数数量的的前提下,通过加宽网络结构进一步提升网络的性能。后来 VGGNet[3]被提出,该网络模型进一步加深了网络的深度进而加强了特征提取性能,使其可以处理更大尺度的图片,提升了卷积神经网络的实际应用价值。2017 年何凯明等人[4]提出了 ResNet 网络模型,该网络解决了深度神经网络的梯度消失问题,使网络的结构可以进一步加深,至今还在广为应用。随后,Huang 等人[5]在 ResNet 上加入了稠密的跳远连接的 DenseNet 网络模型被提出,进一步增加了网络的表征能力,最近,EffcientNet[6]模型分别从宽度,深度及分辨率三个角度对轻量卷积神经网络模型 MobileNet[7]加以改进,达到了目前为止最高的图片分类精度。

伴随着深度神经网络模型的发展,目标检测技术也迎来了空前发展,当前基于深度学习的目标检测模型主要分为两大类,一类是以 RCNN[8],Fast-RCNN[9],Faster-RCNN[10]为代表的基于区域推荐的目标检测模型,该类目标检测模型经过由粗到细两步预测出被检测目标的边界框和类别,有较高的精确度但是检测速度慢。第二大类是以 YOLO[11],SSD[12]为代表的基于回归的目标检测模型,该类模型直接预测出被检测目标的边界围框和类别而无需经过“先粗后细”的过程,有较快的检测速度但是检测精度一般。
.........................

2 基于深度卷积神经网络的目标检测技术

2.1 深度学习概述
深度学习起源可以追溯到 19 世纪 40 年代,其目的是模拟人的大脑来解决一般的学习问题,由于当时没有很好的优化方法导致其在很长时间内停滞不前,直到 1990 年,Hinton 等人提出了反向传播算法,解决了其优化问题,但是由于当时缺乏大规模训练数据,而且计算机性能不足导致训练容易过拟合,所以其逐渐淡出人们的视线。直到 2006年,随着计算机性能的提升以及大规模带标注的训练数据的出现,深度学习开始流行,并首先在语音识别上有重大突破。后来随着自动编码器和受限玻尔兹曼机的出现,其得到了空前发展,向人们展示着其强大的学习能力。近几年,深度卷积神经网络、生成式对抗网络[29]以及深度波尔兹曼机[30]的相继提出使深度学习又迎来了新一轮的研究热潮并影响了整个学术界,已然成为最重要的人工智能技术之一。在计算机视觉领域获得了前所未有的突破性的进展,在速度以及精度上较传统的机器学习方法有很大提升。

........................

2.2 深度卷积神经网络
深度卷积神经网络是最具代表性也是最流行的深度学习方法之一,经过近几年来有简单到复杂再到精细的发展历程,已经取得长足进步并被广泛应用于许多研究领域,例如图像超分辨重建,图像分类,图像分割,图像检索,人脸识别,行人检测和视频分析等。
神经网络最早起源于 1957 年由 Frank[31]提出的感知机模型,这种多层的神经网络直接启发了后来的卷积神经网络。在 1998 年,Le Net[31]网络结构首先由 Lecun 提出,该网络结构采用多级卷积的形式来解决手写数字识别的问题。它是一个 10 分类任务的解决办法,被认为是卷积神经网络的始祖。它包括了两个卷积层,两个下采样层,两个全连接层和一个激活层,最后有一个 Sotfmax 分类层。可以说,Le Net 麻雀虽小,五脏俱全,包括了基本的卷积神经网络的所有单元。2012 年 Alex 等人提出的了 AlexNet[1]以巨大的优势获得了当年 ImageNet 竞赛的冠军。网络结构与大体 LeNet 类似,但其增加了Relu 非线性激活函数,增强了模型的非线性表达能力,成为以后卷积层的标配。而且使用 dropout 层防止过拟合。成为以后全连接层的标配。又引入标准化层,通过局部归一的手段来放大那些对分类贡献较大的神经元,抑制那些对分类贡献较小的神经元,是现代意义上的深度卷积神经网络。 AlexNet 的成功很大程度上地激发了卷积神经网络的进一步研究,之后卷积神经网络开始进入飞速发展阶段,每年都有大量新的模型与应用出现,网络结构逐渐从单纯的增加深度向着越来越多样化演变的同时性能也在不断提升。
VGGNet[3]是 2014 年由牛津大学计算机视觉组和 Google Deepmind 共同设计,主要是为了研究网络深度对模型准确度的影响,该卷积神经网络模型全部使用结构规整的小卷积核的堆叠来实现,通过不断加深网络结构来提升性能。小卷积核的串联可以在保证相同感受野的前提下减少一半的参数,同时对特征的提取能力更强,其作为一个经典的网络结构至今仍在广为应用。
.............................

3 基于多成分融合网络的遥感图像目标检测 ……………… 17
3.1 引言.................17
3.2 双向金字塔融合网络 …………………… 17
3.3 相对区域推荐网络 ……………………… 19
4 基于并行感知注意力网络的遥感图像目标检测 ………………… 30
4.1 引言……………………………… 30
4.2 多尺度注意力模块 ………………………… 30
4.3 上下文注意力模块 ……………………………… 32
5 总结与展望……………………… 41
5.1 总结………………… 41
5.2 展望………………… 42

4 基于并行感知注意力网络的遥感图像目标检测

4.1 引言
现有的很多遥感图像目标检测方法为了加强特征表达,使用相同权重的多尺度特征融合的主干网络,但实验证明了相同尺度的特征图的内部之间以及不同尺度的特征图对网络的贡献程度不同,为了进一步加强网络的特征提取能力并加快检测速度,本章基于注意力机制提出了并行感知注意力网络,该网络主要包括三个并行的注意力模块,分别为多尺度注意力模块,上下文注意力模块以及通道注意力模块,通过三个模块的有效融合不但可以提取目标的多尺度、上下文以及全局特征而且还可以提取非局部的目标间关联特征,然后将可变形卷积应用于融合后的特征图更好提取方向敏感的目标特征,最后,采用距离交并比(Distance Intersection over Union,DIoU)损失代替传统的回归损失,加快训练速度的同时增强了对小目标的检测效果。实验结果表明了本章网络结构在保证较高检测准确率的同时参数量大大减少,检测速度较上一章模型提升 3 倍。网络结构如下图所示:


...............................

5 总结与展望

5.1 总结
遥感图像目标检测技术应用范围广,价值高。随着遥感技术的日新月异,传统的目标检测方法已经无法满足人们对高质量以及大规模遥感数据处理的需求,近年来,随着深度学习这个研究领域的迅速崛起,基于深度卷积神经网络的目标检测技术应运而生,其强大的特征提取能力有效地改善了传统方法的不足,可以很好地应用于遥感图像的目标检测。

本文针对遥感图像中目标尺度变化范围大,小目标众多以及有些目标处于遮挡或复杂背景等情况下导致现有深度学习方法的误检及漏检率仍然较高问题,进行了详细研究并提出了基于深度卷积神经网络的目标检测方法,大量的对比试验以及消融实验证明了本文方法的有效性,本文的总结如下:
第一,本文提出了一种基于多成分融合的深度卷积神经网络模型来提升遥感图像目标检测精度,首先设计了双向金字塔融合网络作为特征提取的主干网络,该网络在各个尺度特征图中引入卷积和反卷积操作以获取相同深度下不同尺度的特征图,进而通过拼接操作融合不同深度下相同尺度的特征图,有效地改善了深度卷积神经网络随着深度的加深而空间信息逐渐缺失的局限性,提高了遥感图像中小目标的特征提取能力。然后提出了相对区域推荐网络,该网络根据相对交并比的大小,最大化地学习小目标的特征和大目标的局部特征,并得到初步检测结果。最后通过上下文信息网络对相对区域推荐网络得到的初步结果强关联的背景信息的学习,提升复杂背景下检测结果的同时得到了更加优化分类和定位结果。通过对比和消融实验证明了本模型在检测遥感图像中的小尺度目标甚至是处于遮挡或复杂背景中目标时有良好表现。
第二,为了进一步加快模型检测的速度,本文又提出了并行感知注意力深度卷积神经网络结构,该网络结构主要由并行的多尺度注意力模块,上下文注意力模块以及通道注意力模块组成。首先通过融合多个尺度下三个并行模块的输出,可以获得丰富的多尺度特征,上下文特征以及非局部的关联特征,然后在得到的融合后特征图中使用可变形卷积代替传统卷积,从而更好地提取方向敏感的目标特征。最后使用距离交并比损失代替了传统的边界框损失,在加快模型收敛速度的同时能够获得更精确的目标定位。
参考文献(略)

如果您有论文相关需求,可以通过下面的方式联系我们
客服微信:371975100
QQ 909091757 微信 371975100