平面几何图像中特征信息的抽取技术探讨

论文价格:0元/篇 论文用途:仅供参考 编辑:论文网 点击次数:0
论文字数:**** 论文编号:lw202329780 日期:2023-07-22 来源:论文网
本文是一篇软件工程论文,本文的主要工作如下: (1)针对几何图像中多边几何图形的识别,本文提出了基于改进的 FAST 角点检测器用于多边几何图形识别的方法。首先对图像进行了预处理和二值化,通过 Freeman链码实现了边缘的提取,由于提取的边缘是具有方向性的,对后面候选角点的提取有着重要的影响,本文考虑利用二次拟合的方法,进行边缘上错误角点的去除,第一利用道格算法进行边缘拟合,去除大量无用的特征点,第二通过最小外接矩形的方式,进一步拟合边缘。然后利用孔洞填充算法,实现几何图形的分割。接下来本文分析了几何图形角点处灰度变化,利用半径大小为 3的圆模板进行像素点的采样,快速筛选出候选角点,最后本文发现图形边缘上的错误角点是离群点,利用 DBSCAN 算法消除离群点,最终实现角点的提取。

第一章 绪论

1.1 论文研究背景
人工智能(Artificial Intelligence, AI)是计算机学科的一个重要分支,是研究如何应用计算机的软硬件来模拟人类某种智能行为的基本理论、方法和技术。作为新一轮科技革命和产业变革的核心驱动,人工智能正不断地影响社会发展和人类生活,同样也促进了教育领域的发展和改革。随着国家不断的加快教育信息化的步伐,智慧教育的出现成为必然趋势,不断得到教师、学生、家长认可。以往需要花费大量的人力、物力以及时间才能完成的任务,现在可以在高效率的人工智能辅助下快速完成,减轻了老师工作和学生学习的负担。学生借助人工智能的帮助,可以强化对知识体系的认知,进行高效的学习。
自计算机之父图灵开创了人工智能领域以来,研究人员一直在进行面向智能化教育服务的软件应用研究。80 年代末,多媒体计算机的出现促进了计算机辅助教学的发展,出现了很多用于教学辅助的软件工具,这成为了计算机技术应用于教育的一个里程碑。如今,随着计算机硬件的发展,人类活动从简单模拟的阶段进入了更加智能化的阶段,如互联网技术下远程教育的应用研究,产生了慕课(Massive Open Online Courses,MOOC)这样的教学平台,为学习者提供定制化的课程,极大的改变了传统教学的方式,让每个人都可以在互联网下享受教育。
数学作为基础教育领域中主要科目之一,是一门以数量和关系为基础的学科,使用机器模拟自动批阅中小学数学题,成为了一项实用价值高、挑战性强的任务。目前,对于客观题的相关技术已经得到了应用,对于主观题的研究并没有达到实用程度,尤其是平面几何题。平面几何的认知作为数学教育的一个重要部分,通过对平面几何的学习可以提高学生的逻辑推理能力和发展创造思维。然而,在平面几何题中,由于自然语言理解研究存在瓶颈以及人类解题这一思维不清楚的问题,很难从描述文本中提取完整信息,图表作为受约束几何对象的可视化表示,利用数字图像处理技术,可以更快更好地从中挖掘几何对象和隐含关系[1]。平面几何题中几何图形类型主要分成两个方面,第一是基本几何图形的研究,例如对直线、圆、椭圆、多边形等基本几何元素的检测,提高学生认知几何图形的能力;第二是复杂几何图形的研究,在初中平面几何题目中,几何图形由多个基本几何元素构成,并与字符组合,对于这种复杂图形处理,需要先提取字符信息,再对其中各基本几何元素进行识别,依据这些信息,挖掘深层次的几何信息,帮助学生自主探索解题步骤的能力。
................................

1.2 国内外研究现状
平面几何图形最早是由 Montalvo 提出,他认为平面几何图形的定义应为计算机视觉和计算机图形学的交叉学科,是获取和检验人视觉上对于图形理解的形式化表达方式的问题[2]。常见的平面几何图形应用多出现在教育上,比如在电学中的电路图,圆形中包含叉的几何图形表示灯泡,直线表示电线;在数学试题中,平面几何图形的绘制除了是对数学题目中语言描述信息的展示,也是出题人对平面几何试题中隐含知识的延伸;在平面几何图形检索[3-4]中,通过将几何图像中的几何图形进行特征提取、量化特征、建立索引,利用检索的方式与数据库中的其他几何图像进行信息匹配,实现图形检索功能。这些包含在平面几何图形中的视觉信息:点、线、圆等,都需要利用计算机视觉相关技术进行分类处理及应用,为平面几何相关研究内容提供了更多的可能性。
早期,几何图形的识别研究很大程度上依赖于数学参数方程式[5],例如霍夫变换[6]提取的直线、圆,最小二乘法用于拟合天文观测中的椭圆,利用 Freeman 链码[7]进程轮廓追踪,通过分析轮廓的几何性质判断当前轮廓构成的几何形状等。近年来,一种更加聚焦于图像底层信息的方法出现,通过挖掘图像中 1 像素构成不同方向的线段,梯度法分析线段之间的关系,判断不同线段是否属于同一线段或圆上,例如 Goio[8]等人在 2012年发表的直线段检测(LSD)算法以及 Akinlar[9]等人在 2013 年发表的实时圆检测器(EDCircle)算法。
这些算法的实现,大大简化了平面几何图形信息的抽取工作,很多学者将图形识别技术应用到不同领域,用作实际产出,其中智慧教育是最早应用图形处理技术的领域之一。在 20 世纪 70 年代,国外学者们开始基于 OMR 技术[10]生成的几何图像进行识别研究。由于技术壁垒,国内很难对其技术进行借鉴。我国直到 80 年代才开始基于该项技术进行研究。图像处理技术的成熟和开放性,学者利用扫描仪或者数码相机等设备获取几何图像,从中挖掘几何信息。


软件工程论文怎么写

......................

第二章 相关技术与理论

2.1 图像区域分割
几何图像通常出现在电子教材或其他数字文件中,例如 PDF 文档、数字照片、扫描图等。由于数字图像中的数学试题常常是文字和图像的混合,需要先进行区域的分割,将需要的几何图像提取出来。
图像的分割是将试题图像中按照不同信息内容划分不同区域。主要将图像划分成学生个人信息区域、客观题区域以及主观题区域三个区域。网上流行的阅卷系统主要通过系统内部预设的模板定位标记,判断学生的作答情况,这种方式简单快速,但是对于一般的电子文档图片,系统需要通过一定的图像处理技术,进行复杂计算生成具有图像描述信息的 XML 描述文件[16]来获取分割的位置,处理过程中涉及大量的运算,降低了系统的效率。常见的图像分割算法有四种类型:阈值分割法、边缘分割法、区域分割法和投影分割法。
2.1.1 基于阈值的图像分割法
在图像中常用的特征有颜色、形状、纹理三大类,其中颜色对人的视觉冲击感最强,也是最简单最直观的特征,成为使用最为广泛的特征之一。对于一幅图像,其中包含的图像信息有两类,一类是全局的颜色信息,另一类是局部的颜色信息。全局的颜色信息包含了图像中主要的色调,比如蓝天、白云、绿草,这些名词中包含了人类对于事物最为直观的描述。而局部的颜色信息主要形成有关纹理、形状以及轮廓等特征。
基于阈值的图像分割法,其分割原理是通过对图像中的色彩特征信息进行分析,利用阈值将得到的特征信息进行分类,实现图像分割。阈值分割法作为经典的分割算法之一,被广泛的应用到图像处理领域和计算机视觉领域。由于该方法基于阈值进行分割,如何选取一个合适的阈值是该方法的关键,常见的方法有直方图阈值法、大津法(Otsu)等。
................................

2.2 角点检测算法
角点作为描述目标特征的重要特征,被广泛用于图像处理和计算机视觉任务[34],例如特征提取、目标匹配和目标追踪等。但是,到现在仍然没有一种能够完全表示角点的数学方法。通常认为,角点要么是灰度急剧变化的点,要么是图像边缘曲线上具有最大曲率的极端点[37]。角点检测主要有三种方法[38]:基于灰度图像的角点检测、基于轮廓曲线的角点检测和基于二值图像的角点检测。
2.2.1 基于灰度图像的角点检测
基于灰度图像的角点检测方法先将图像转换成灰度图像,并通过计算邻域灰度强度变化来确定角点。
Moravec[39]算法是最早的角点检测算法,Moravec 发现在同质区域、边缘和角点存在明显的差异,通过将每个像素窗口与其周围八个不同方向窗口之间的平方差和的最小值作为响应值,再使用局部最大值抑制算法消除伪角点。然而,该算法对边缘敏感并且不具有旋转不变性特征。
最后对 R 做非极大值抑制得到局部灰度变化最大的角点位置。Harris 的响应函数阈值需要人为的进行控制,不同阈值对于角点检测的影响有着极大的差别,因此如何自适应的解决角点的响应值是其核心内容。
Rosten 和 Drummond[41]提出了快速角点检测算法,通过利用类圆模板,分析模板上像素点的分布,实现候选角点的提取,再利用决策树来加速角点检测过程,这种方法简单有效,但是对于复杂,密集的角点图像,计算的复杂度将会提高,精确度将会降低。Biadgie 和 Sohn[35]为了进一步提高 FAST 角点检测器的性能,通过多尺度空间和多掩模来提高算法的计算效率和可重复性。
........................

第三章 基于改进的 FAST 角点检测器用于多边几何图形识别 ....................... 13
3.1 图像预处理 ............................................ 13
3.1.1 二值处理 ................................... 13
3.1.2 噪声处理 ..................................... 14
第四章 一种鲁棒性强的粘连字符提取方法 ................. 25
4.1.粘连字符处理 .................................... 25
4.1.1 预处理 ....................................... 25
4.1.2 类拉普拉斯算子 .......................................... 26
第五章 从图像中检索几何信息 .............................. 38
5.1 直线段抽取 ....................................... 38
5.1.1 预处理 ................................. 38
5.1.2 线段合并 ...................................... 38

第五章 从图像中检索几何信息

5.1 直线段抽取
5.1.1 预处理
基于 4.1 节中提出的粘连字符提取方法,将提取出的有效字符从图像中去除,保留几何图像。由于图像容易受到噪声的影响,需要对图像进行灰度变换和平滑操作(采用核大小为 3x3 的高斯核进行平滑),再利用 Otus 算法对图像做目标像素和背景像素的分离,进行二值化,最后对图像进行细化操作,保证边缘上的线段是 1 个像素宽。
5.1.2 线段合并
由于图像中几何图形图像本身具有离散化误差,这对线段检测有一定的影响。


软件工程论文参考

..............................

第六章 总结与展望

6.1 研究总结
教育信息化时代的发展,智慧教育的需求变得越来越强烈,相关技术也被广泛应用到教学中。本文针对数学几何试题中平面几何图像相关处理技术展开研究。在现有的技术基础上,实现了对图像中多边形图形识别和几何图形信息的抽取,并对各种技术进行了实验验证,结果证明了本文技术的有效性,本文的主要工作如下:
(1)针对几何图像中多边几何图形的识别,本文提出了基于改进的 FAST 角点检测器用于多边几何图形识别的方法。首先对图像进行了预处理和二值化,通过 Freeman链码实现了边缘的提取,由于提取的边缘是具有方向性的,对后面候选角点的提取有着重要的影响,本文考虑利用二次拟合的方法,进行边缘上错误角点的去除,第一利用道格算法进行边缘拟合,去除大量无用的特征点,第二通过最小外接矩形的方式,进一步拟合边缘。然后利用孔洞填充算法,实现几何图形的分割。接下来本文分析了几何图形角点处灰度变化,利用半径大小为 3的圆模板进行像素点的采样,快速筛选出候选角点,最后本文发现图形边缘上的错误角点是离群点,利用 DBSCAN 算法消除离群点,最终实现角点的提取。
(2)针对几何图像中字符与线段粘连的情况,本文提出了一种鲁棒性强的粘连字符提取算法。利用类拉普拉斯算子的孤立点的去敏感化特性,组合不同尺度的类拉普拉斯算子实现线段与字符切割。由于轮廓检测算法在提取字符过程中会出现一个字符有多个大小不一的边框,因此本文分析了边框之间的关系:外切、相离、相交和包含,将NMS 算法和边缘修复算法融入到轮廓检测算法中,最终实现字符的有效提取。实验过程中,利用卷积神经网络验证了字符提取的完整性,结果表明本文的方法有着较强的鲁棒性,能够很好的实现字符完整提取。
(3)针对从图像中检索几何信息,本文利用改进的 Hough 变换的方法提取了直线段和圆。针对直线段的提取,在提取过程一条边缘会产生大量的直线段信息,本文通过线段聚类的方式,实现同一条直线段的合并,由于 Hough 变换是通过投票数控制直线段提取,提取到的线段并不完整,本文进一步利用线段之间的交点实现直线段的修复。在交点产生过程中,又出现了 3 种错误交点:冗余交点、偏离交点、边缘交点,通过分析交点的特性,首先利用点到线段的距离,删除偏离交点;
参考文献(略)
如果您有论文相关需求,可以通过下面的方式联系我们
客服微信:371975100
QQ 909091757 微信 371975100