基于自适应阈值的图像增强算法
开题报告
目 录
一、选题背景
二、研究目的和意义
三、本文研究涉及的主要理论
四、本文研究的主要内容及研究框架
(一)本文研究的主要内容
(二)本文研究框架
五、写作提纲
六、本文研究进展
七、目前已经阅读的文献
一、选题背景
图像,指的是客观物体在人脑中的自然反映,它是信息传递的重要媒介,以纸张,照片,计算机屏幕等介质呈现出来。现实中,人类大部分的信息都是通过人眼观察的方式取得。五种感官方式中视觉是主要的获取方式。然而,由于光照,噪声,介质形状等多方面因素的影响,在图像的生成和传输过程中,图像会发生质量降低的情况,如对比度偏低,图像明暗不均,几何形变等。因此,需要进行图像处理,以取得符合人们应用需求的图像。数字图像处理,指的是以数学运算为方式,对图像作出的各种加工过程,目的是得到对用户适用的效果⑴。这些过程包括降噪、配准、增强、压缩等,它们与现实中的生产过程是紧密结合的。数字图像处理,起始于1950年代,至1960年代时从计算机学中分离出来,形成独立发展的学问。经过半个多世纪的扩充,现在图像处理的技术基础己经很稳固,在许多社会领域广泛运用。如气象部门通过对遥感图像的处理,得到更加有效的天气云图,提高了预报的准确性;林业部门通过对航拍图像的分析,评估森林发生火灾险情的可能性;航天部门需要对飞行器传回的图像进行处理才能得到更多更清晰的细节;医疗部门的CT诊断技术采用图像重建技术,获得人体各部位的重建图像,而对X射线图像的处理能突出病变区域的显示效果,让医生得以准确地判断病变区域;在安检领域,对阿尔法射线照射图像的处理,使得包裹内物品的形状和层次更加清晰,利于判断物品类型。现在,数字图像处理技术和流行的技术相结合(如生物技术、人工智能、智能终端等),以后将有更好的发展。数字图像处理按照方式和目标的不同大致分为以下几类:一是提高图像的视觉效果,如增加对比度,色彩变换,几何变换等,本文主要讨论的图像增强就属于这一方面;二是获取图像的特征信息,以满足匹配的需要,如获取边缘信息,颜色特征,纹理特征等;三是图像的压缩编码方面,这是为了减小图像的大小同时一定程度上保证图像质量,使得传送更为容易。从具体方法来看,数字图像处理常用方法有图像变换,图像分割,图像配准,图像增强,图像特征提取等。图像增强,指的是在一定的处理背景下(如整体偏暗,对比度不足等),提升图像上用户感兴趣的部分,同时抑制甚至去除不感兴趣的部分,提升图像区域之间的差异,以突出某些部分的特征的过程。它的目的是提高图像中有用信息的显示效果,使图像更利于机器识别和视觉观察,达到特定的分析目标。图像增强是整个处理过程中非常关键的一环,在这个步骤序列中起着承上启下的作用。很多情况下,设备采集到的图像不能直接满足特定的分析需求,需要采用一些图像增强方法对图像进行预处理,处理后的图像再交给业务处理部分。例如,医疗中X射线照射生成的图像可能因为对比度不足而难以识别,可以先进行图像增强处理,再用其他算法标注可能的病灶区域,可以提高诊断准确性。图像增强的主要目的在于两点:一是提升视觉效果,使图像更清晰,人眼观察时更容易获取需要关注的区域;二是使图像的呈现形式更容易被机器处理,通过机器解析出人们想要的信息。例如,军事侦查卫星得到的遥感图像可能经过了伪装处理,其中的重要建筑,车辆等混为一体,不易分清,进行图像增强处理可以突出诸如机场、桥梁、车辆等元素,再对不同时段的遥感图像对比处理,能够更正确完整地观察对方部署的变动情况。图像增强在技术的选取上并不是一劳永逸的,不同的方法有不同的使用情况。
二、研究目的和意义
本文将阐述图像增强的数学基础和一些典型的算法,并提出自己的改进后的方法。本文所做研宄的项目来源为十一五国家科技支撑平台重点项目课题:便携智能阅读器和国家自然科学基金项目(61371142):基于逆向工程的扭曲文档图像校正技术研宄。前一个项目的产品智能阅读器是本课题的研宄平台,该产品是一款基于文字识别的有声电子阅读产品,主要通过拍照方式获取印刷文字信息,经OCR识别后转换为语音后输出。是为盲人及弱视等人群阅读普通书籍所准备的视听转换工具。借助该产品,盲人可阅读纸质书籍杂志、菜单、说明书等。图像增强是阅读器处理过程中的重要步骤,包括了灰度增强和位置增强,目的是提高图像的人眼视觉效果和机器处理精确度。后一个项目是前一个的延伸,这个项目通过基于模型的、基于连通域的或基于3D的等各种方法,来实现扭曲文本的校正工作,以达到位置增强的目的。本课题从基于模型的思路出发,提出了一种新的抛物线数学模型,对文本线进行遍历,得到一系列文字的位置点,用位置点的坐标结合模型拟合出文本线,根据文本线与水平线之间的差距进行精确恢复,以得到水平分布的文本行。
三、本文研究涉及的主要理论
图像处理经过半个多世纪的发展,现在在技术基础上己经比较完备。图像增强作为其中的重要部分,也在技术的更新换代中不断地推陈出新,产生新的方法。图像增强方法于二十世纪六十年代为起步时期,它在美国喷气推进实验室获得第一次实用化。实验室人员对航天飞行器传回的图像数据进行了一系列的增强处理,如灰度变换,几何变换等,获得了质量优良的月球表面图像,图像增强技术展示出了强大的应用潜力"]。此后,该技术又多次用于火星,土星等探测图像的优化工作,赢得了巨大的技术成功。七八十年代,图像增强技术与其它领域结合,步入了快速发展时期。例如,这一时期,图像增强技术用于指纹识别领域,通过提升指纹的生成效果和提取质量,使指纹识别的准确率得以保障,指纹识别因此成为实用化的技术。图像增强也应用于了医疗领域,一方面用在显微镜光学成像,对生成的影像进行了大幅度的视觉优化处理,可以对细胞结构,细菌形状,染色体形状等进行更细致的分析;另一方面,是用在X射线所产生图像的处理上,同样对影像效果有了大幅度的提升1990年代以后,图像增强步入普及民用化时期。由于硬件技术的发展,电脑的处理速度快速增长,制造成本却大致遵循着摩尔定律不断下降。图像增强技术普遍应用于生产的各个方面,针对于各行各业生产环境的增强方法大大增加了。二十一世纪以后,图像增强研宄的发展又有新的特点,其中包括大数据量,实时性,与互联网技术结合,用户定制需求,与人工智能结合,与智能终端结合等。图像增强的方法按照是否经过变换可分为:空域增强和变换域增强。空域增强是以图像各点的像素值为一般处理对象,通过对像素值的单独的或邻域的公式运算来实现提升显示效果的目的,例如灰度变换就是按照公式对像素值进行一一替换,直方图均衡则按照均衡分布的准则重新安排像素值;变换域增强则不是操作像素值本身,而是令其转换到某一变换域后,根据其在变换域中的分布特点进行针对性的操作,如傅立叶变换是转换到频率域上,小波变换是转换到小波域上。转换后的处理方式有同态滤波,带阻滤波等还有其他一些较独立的方法。如数学形态学方法,它是一种用来解析几何形状的方法,被应用于图像处理中。它包括一些特定的结构元素,通过这些结构元素对图像进行操作,可以提取图像中的对应形状。这样将形状和背景分离开,分别加以强调和抑制处理,可以达到图像的增强效果。
另外,图像增强与其他领域的方法相结合,出现了很多新的处理方法,如与模拟神经信号传递的神经网络算法相结合的新方法,利用神经网络得到一种非线性增强方式,对图像进行直接增强前面提到过,本文提出的方法是以智能阅读器的产品为基础的,产品组成如图。这款产品包括了一个图像采集器和一款配套的软件,采集器通过USB线连接到电脑上,采集到的图像经过软件的识别,生成电子文档,再转化为声音信号播放出来,这样实现文本图像的可读化。该机的便携版是将软件烧录到阅读器内的单片机,实现类似的处理过程,便携式阅读器通过电供电,省去了与电脑连接的过程。这款软件的处理过程大致包括这几个步骤:一是图像采集;二是图像预处理;三是文字识别;四是语音合成。图像增强是预处理步骤屮的一个组成部分,一般来说,排在前面的步骤会影响后续处理的结果,这样图像增强对后面的二值化、版面分析都会有显著影响,所以探究效果更好的增强算法是很有必要的。这种增强的效果既可以体现在图像亮度的针对性提升或削弱,也可以是体现在图像各点位置的调整和校正上,目的都是利于后续的分析步骤。
四、本文研究的主要内容及研究框架
(一)本文研究的主要内容
灰度变换,直方图均衡,中值滤波等方法是图像增强中的典型方法,本文将在概念介绍后首先讲解这些方法。基于小波变换的增强是本文着重探讨的地方,包括了理论和具体方法。另外一部分就是作为视觉增强的几何扭曲校正方法。本文以BMP格式图片为基本图片处理格式,对多种方法进行了实验。实验结果,这种方法处理对比度不理想的图像时,有良好的增强结果。全文共分五章,具体安排如下:
第一章绪论,介绍了图像增强研究的出发点和本文的内容安排。
第二章阐述图像增强现在的发展状况,先是概要地阐述若干经典的方法,如灰度变换,直方图均衡等,然后介绍了现在己有的小波阈值化处理方法,在介绍这些方法的时候会注重数学原理和实现方法的阐述。
第三章介绍了图像增强的程序,包括程序实现的功能和逻辑流程,然后介绍了程序的主要文件和功能函数,最后对部分核心代码进行了分析。
第四章阐述方法的过程。先是本文提出的基于自适应阈值的小波增强方法,对阈值的选取进行了细致的数学分析,然后介绍方法的实现过程。另外,位置增强的方法,具体指针对文本文档的几何扭曲状况,提出一种快速的校正方法,使得图像平直排布,提升了视觉效果。
第五章是实验工作,对新提出的图像增强方法进行了仿真,得到了直观的图像对比和客观的数据表格,并根据一些评判参量对方法进行了评价。
第六章总结,概括讲述本文所作出的研宄工作,分析现有工作的成果和不足之处,为下一步的研究工作做铺塾。
(二)本文研究框架
本文研究框架可简单表示为:
五、写作提纲
摘要 3-4
Abstract 4
第一章 绪论 7-10
1.1 选题背景 7-8
1.2 本文的内容安排 8-10
第二章 研究现状 10-21
2.1 增强理论简介 11-17
2.1.1 灰度变换 12-15
2.1.2 直方图均衡 15-17
2.2 小波变换增强的研究 17-21
2.2.1 阈值化的方法 17-19
2.2.2 与直方图均衡结合 19-21
第三章 程序的基本架构 21-27
3.1 程序简介 21-24
3.1.1 程序框架 21-23
3.1.2 程序流程 23-24
3.2 主要文件和功能函数 24-25
3.3 部分核心代码 25-27
第四章 增强方法的具体实现 27-41
4.1 小波变换简介 27-32
4.1.1 连续小波变换 27-28
4.1.2 离散小波变换 28-29
4.1.3 多分辨分析与Mallat算法 29-32
4.2 基于自适应阈值的增强 32-35
4.2.1 用于增强的阈值 32-34
4.2.2 用于降噪的阈值 34-35
4.2.3 方法流程 35
4.3 位置增强的扭曲校正方法 35-41
4.3.1 原理简析 35-36
4.3.2 抛物线模型 36-38
4.3.3 类抛物线模型 38-39
4.3.4 方法实现 39-41
第五章 实验结果 41-48
5.1 基于自适应阈值的增强 41-46
5.2 扭曲校正方法 46-48
第六章 总结 48-49
6.1 课题工作总结 48
6.2 展望 48-49
参考文献 49-52
申请学位期间的研宄成果及发表的学术论文 52-53
致谢 53
六、本文研究进展(略)
七、目前已经阅读的主要文献
[1] Rafael C. Gonzalez, Richard E. Woods, Steven L. Eddins.阮秋琦译.数字图像处理[M]. MATLAB版.北京:电子工业出版社,2012.
[2]张宏林.精通Visual C++数字图像处理典型算法及实现[M].第二版.北京:人民邮电出版社,2008.
[3]祁燕,宋凯.基于小波多尺度的图像增强新算法[J].微计算机信息,2010,26(10):133-134’ 142.
[4]郑江云,江巨浪,黄忠.基于RGB灰度值缩放的彩色图像增强[J].计算机工程,2012,38(2): 226-228.
[5]蔡利梅,钱建生,罗驱波,等.一种基于色彩保持的低照度图像增强算法[J].计算机应用与软件,2009,26(3) : 226-227,243.
[6]杨永勇,林小竹,等.彩色图像增强的几种方法研宄比较[J].北京石油化工学院学报,2006,14(3) : 43-47.
[7]王学伟,王世立,李珂.基于伪中值滤波和小波变换的红外图像增强方法[J].激光与红外,2013,43(1) : 90-93.
[8]尹士畅,喻松林.基于小波变换和直方图均衡的红外图像增强[J].激光与红外,2013,43(2): 225-228.
[9]陈超.改进单尺度Retinex算法在图像增强中的应用[J].计算机应用与软件,2013,30(4) : 55-57,74.
[10]李小霞,李铖果,邹建华,等.一种新的低照度彩色图像增强算法[J].计算机应用研宄,28(9): 3554-3555,3558.
[11]王慧琴.小波分析与应用[M].北京:北京邮电大学出版社,2011.
[12] Albert Boggess, Francis J. Narcowich.荷国胜,康健译.小波与傅里叶分析基础[M].北京:电子工业出版社,2010.
[13]尹红然,俞浩,秦清锋.一种基于Retinex理论的彩色图像增强算法[J].电子科技,2012,25(3) : 21-24.
[14]张瑞强,齐l通过点运算进行数字图像处理[J].实验室科学,2008, (4): 61-62.
[15]陈守刚.基于直方图均衡化的彩色图像增强研宄[J].重庆三峡学院学报,2012,27(3):74-77.
[16]唐志航,黄哲,张东衡,等.基于尺度相关性的自适应图像增强新算法[J].计算机应用,2006, 26(9) : 2084-2085, 2088.
[17]周旋,周树道,黄峰,等.基于小波变换的图像增强新算法[J].计算机应用,2005,25(3) : 606-608.
[18]吴桑,彭良玉.基于小波变换的图像增强新算法[J].现代电子技术,2013, 36(4):89-91.
[19]王小明,方晓颖,刘锦高.复杂光照下的自适应人脸图像增强[J].计算机工程与应用,2011,47(2) : 15-18.
[20]熊秋菊,杨慕升.数字图像中边缘检测算法的对比研究[J].机械工程与自动化,2009,(2): 43-44,47.
[21]刘茜,卢心红,李象霖.基于多尺度Retinex的自适应图像增强方法[J].计算机应用,2009,29(8): 2077-2079.
[22] Xuli Zong, Andrew F. Laine, Edward A. Geiser. Speckle Reduction and ContrastEnhancement of Echocardiograms via Multiscale Nonlinear Processing [J]. IEEE TransMed Imaging, 1998, 17(4): 532-540.
[23] David L. Donoho, Iain M. Johnstone. Ideal spatial adaptation by waveletshrinkage [J]. Biometrika, 1994, 81(3): 425-455.
[24] Ching-Tang Hsieh, Eugene Lai, You-Chuang Wang. An effective algorithm forfingerprint image enhancement based on wavelet transform[J]. PatternRecogonition, 2003,32(2): 303-312.
[25]张德丰.Mat lab小波分析与工程应用[M].北京:国防工业出版社,2008.
[26]周伟.基于MATLAB的小波分析应用[M].第二版.西安:西安电子科技大学出版社,2010.
[27]李冠章,罗武胜,李沛.基于人眼视觉特性的彩色图像增强算法[J].光电工程,2009,36(11) : 92-95.
[28].周密,李尊尊,耿国华.基于小波阈值的图像去噪方法研宄[JL计算机技术与发展,2008,18(5) : 22-24.
[29]叶重元,黄永东.小波阈值去噪算法的新改进[J].计算机工程与应用,2011,47(12):141-145.
[30]吕慧显,杨滨,李京.基于局部化自适应阈值的小波图像降噪[J].青岛理工大学学报,2010,31(2): 118-122.