对获得最佳背景分割的图像,采用圆形 Hough 变换法检测葡萄果粒,最后开发算法实现了葡萄果穗成熟度的准确判断,为果农适宜期收获葡萄提供指导,并为今后葡萄自动化采摘提供研究基础。
第一章 绪论
1.1 研究背景与意义
1.1.1 红提葡萄种植生产现状
红提葡萄,又名红地球,原产于美国加州,粒大、甘甜、耐储运、产量高,是鲜食葡萄的优质品种,其产量在我国葡萄产量中居于首位[1-3]。新疆是红提葡萄的主要产区,年产量高达 10 万 t 以上[4],约占我国葡萄产量 23%[5]。新疆红提种植面积逐年增加,第五师建成了全国最大的红提葡萄生产基地[6]。据统计,2018 年新疆各生产建设兵团红提种植面积已达 11 623 hm2,产量 26 万 t[7]。目前,葡萄产业正面临由数量型向质量型转变的任务[8],红提葡萄质量的提高对提高新疆人民经济发展水平具有重要意义。
1.1.2 红提葡萄产业存在的问题
红提葡萄以鲜食为主,是一种非呼吸跃变型果实,采摘后无后熟期,且可溶性固形物、可滴定酸度和整体感官特性均不再发生改变,因此,在最佳成熟阶段收获红提至关重要[3,9-10]。上世纪 70 年代起,机器视觉技术开始逐渐应用于农业[11],葡萄采摘机器人也进入研究阶段,但在研究过程中仅关注了葡萄果穗采摘的定位,而忽略了葡萄成熟度的影响。若红提葡萄果穗成熟度判断不准确,将导致过早采摘或过熟采摘,过早采摘不利于出售;而过熟采摘,葡萄果实颜色过深,失去了红提原本鲜艳的玫瑰红成为“黑地球”,影响商品价值[12]。此外,过熟葡萄易出现烂果,易为鸟类所害[10、13]且不利于贮藏[10]。因此,对红提葡萄成熟度进行准确判别,是保持红提葡萄的优质品质并提高商品率的关键。
实际上,对于单粒红提葡萄成熟度,果农通过品尝或表皮颜色即可做出判断,但该方法主观性较强,对品质的判断存在较大误差。而在红提葡萄果穗中,不同果粒间成熟度不一致,使果农对整穗葡萄成熟度判断困难且判断效率低下。因此,有必要对葡萄果穗的成熟度进行快速准确检测检测以提高收获葡萄的品质,辅助农户合理分配劳动力,减少人力资源的浪费,这不仅有助于提高红提葡萄商品率,而且也可以为机器人采摘提供研究基础。
.............................
1.2 国内外研究现状及分析
1.2.1 葡萄及穗状果实成熟度判断的研究现状
目前,国内外对葡萄成熟度的研究已有较多研究报道。早在 1980 年,Lee 和 Bourne通过穿刺法检测了葡萄的硬度及糖含量以判断其成熟度[14],但穿刺法属于破坏性检测,不适于葡萄成熟度的检测。2003 年,Herrera 等人采用便携式近红外光谱仪并结合接触探针,对采后霞多丽、赤霞珠葡萄的总可溶性固形物含量进行检测以判断葡萄成熟度[15],Nogales-Bueno 等(2014)针对成熟期间葡萄果穗的高光谱图像,用光谱预处理和偏最小二乘回归法将光谱数据与内部品质参数关联,能够实现对红葡萄和白葡萄成熟度的检测[16]。但以上检测方法是对采后葡萄成熟度的识别,而且光谱法由于其检测装置复杂且成本高,尚未在葡萄成熟度检测中有实际应用[17-18]。
.................................
第二章 基于 Faster R-CNN 红提葡萄图像的果穗目标识别
2.1红提葡萄图像采样
试验所需图像样本采自新疆维吾尔自治区石河子市石河子大学试验园(44°20′N,85°59′E),海拔 373 m。该葡萄园管理良好,红提葡萄品种栽植龄均在 3 a 以上,单篱架,南北成行,多主面扇形整枝,架面通风,透光良好,株距 0.9 ~1.2 m,行距 2.7 m。
2019 年 8 月 10 日至 9 月 15 日为红提葡萄采收期,本研究在采收期采集田间自然生长条件下葡萄果穗图像。采样时间在每日上午 8:00 — 12:00。分别采用 3 种带有不同图像处理器的智能手机,即 iphone8、HUAWEI Mate 10、MI 5X 分别获取红提葡萄 RGB图像以保证样本的多样性,像素分辨率分别为 4 032 × 3 024(4 : 3),3 968 × 2 976(4 : 3),4 000 × 3 000(4 : 3)。手机摄像头距葡萄果穗 13 ~ 57 cm,图像采集时,采用随机方式在同一株的上、中、下位置拍摄不同成熟度的红提葡萄,图像采集包括逆光和顺光,如图 2-1 所示。每隔 5 天采集 1 次,每次采集红提葡萄图像后以采集日期命名,顺光和逆光图像分别为 890 张和 450 张,共 1 340 张图像。
.............................
2.2红提葡萄图像数据集的建立
2.2.1红提葡萄图像预处理
由于 3种手机拍摄图像大小不一致,本研究将所有图像尺寸统一调整为 3 968 × 2 976像素,再压缩为 298 × 397 像素以提高网络训练速度。在卷积神经网络学习数据时,图像中的高频特征容易导致神经网络过拟合。高斯噪声的添加可以使图像样本在所有位置上都产生数据点,能够有效抑制图像的高频特征,减弱其对模型的影响[52]。因此,如图2-2 所示,本研究对图像添加高斯噪声,噪声对图像平均值的偏移量(均值)为 0,图像噪声的躁动范围(方差)为 0.01。
...........................
第三章 红提葡萄果穗图像的背景分割...............................25
3.1 引言.......................... 25
3.2 基于 KNN 算法的红提葡萄果穗背景分割.......................... 25
第四章 红提葡萄果粒的识别及其成熟度分类................................33
4.1 引言................................. 33
4.2 红提葡萄果穗图像的边缘提取...............................33
第五章 红提葡萄果穗的成熟度判别............................................40
5.1 引言.......................... 40
5.2 葡萄果穗成熟度的判别方法.............................40
第五章 红提葡萄果穗的成熟度判别
5.1葡萄果穗成熟度的判别方法
红提葡萄果穗的成熟度判别流程如图 5-1 所示,首先采用 Faster R-CNN 模型识别田间葡萄图像中的葡萄果穗,然后采用 KNN 法对果穗进行背景分割,背景分割后的果穗图像通过圆形 Hough 变换法检测出葡萄果粒,计算各葡萄果粒表面 H 值进行果粒成熟度等级划分,最后根据不同成熟度等级果粒占果穗的百分比实现葡萄果穗成熟度判别。
..............................
第六章 结论与展望
6.1 主要结论
本研究构建 5 种 Faster R-CNN 网络迁移学习模型进行训练,确定最优模型实现田间红提葡萄果穗的完整准确识别,然后分别采用 Otsu 法和 KNN 算法对葡萄果穗进行背景分割,对获得最佳背景分割的图像,采用圆形 Hough 变换法检测葡萄果粒,最后开发算法实现了葡萄果穗成熟度的准确判断,为果农适宜期收获葡萄提供指导,并为今后葡萄自动化采摘提供研究基础。论文的主要结论如下:
(1)对 Faster R-CNN 模型进行迁移学习,选择 ResNet50,GoogleNet,VGG16,VGG19 和 AlexNet 5 种网络作为 RPN 进行训练,并进行田间红提葡萄果穗识别性能的对比,结果表明 VGG16 迁移学习的 Faster R-CNN 网模型识别效果最好,当模型学习率为 0.0001,训练次数为 20 次时,平均检测时间 26 ms,识别模型平均精度达 99.07%,模型识别置信度均在 0.88 以上,能够准确且较完整地识别葡萄果穗。
(2)通过比较 Otsu 法和 KNN 算法两种方法对识别的红提葡萄果穗图背景分割效果,明确了 KNN 算法更适于红提葡萄果穗背景分割,当 K 近邻数值为 5,并采用马氏距离计算方式得到的分割效果最佳,背景分割的准确率和 F1值分别为 84.61%和 85.06%。
(3)对背景分割的红提葡萄果穗进行边缘提取研究,发现采用图像一阶导数的梯度图像结合 Log 算子可提高图像边缘提取效果,当边缘阈值和灵敏度分别取 0.15 和 0.94时,圆形 Hough 变换法可以在较高运算速度下提取葡萄果穗图像中果粒,准确率可达96.56%。
(4)通过对圆形 Hough 变换法检测的葡萄果粒进行 HSV 空间的 H 值计算,并结合葡萄种植技术员对葡萄果粒成熟度的判断,可将葡萄果粒分为 4 个成熟度等级,G1级:0.167 < H ≤ 0.333;G2 级:0 < H ≤ 0.167;G3 级:0.333 < H ≤ 0.833;G4 级:0.833 < H < 1, H = 0。
(5)开发了葡萄果穗成熟度判断算法,根据成熟果粒数量占整穗果粒数量的比例可将葡萄果穗分为 4 个等级,通过混淆矩阵分析可知,本研究算法对红提葡萄果穗成熟度判断的总体准确率为 91.14%,当整穗葡萄果粒颜色相近时,该方法较人眼判断更为准确。
参考文献(略)