SCI论文(www.lunwensci.com):
摘要:为了对栽培的苹果果树品种进行准确分类,本实验对甘肃省平凉市静宁县果树果品研究所苹果良种苗木繁育基地的10个苹果品种作为研究对象,在基于改进的VGG神经网络上对苹果果实数据集上进行试验,结果表明本算法识别正确率高达99.84%,对比其他分类方法本实验模型的识别性能更好。
关键词:卷积神经网络;苹果果树品种;苹果果实;分类;VGG
Variety Identification of Apple Fruit Based on Improved VGG
CHEN Yongwei1,2,HAN Junying1,REN Xitong2
(1.College of Information Science and Technology,Gansu Agricultural University,Lanzhou Gansu 733070;2.Pingliang Mechanical&Electrical Engineering School,Pingliang Gansu 743400)
【Abstract】:In order to accurately classify the cultivated apple fruit tree varieties,this experiment takes 10 apple varieties in the apple improved seed seedling breeding base of Jingning County fruit tree and fruit research institute,Pingliang City,Gansu Province as the research object,and tests the apple fruit data set based on the improved VGG neural network.The results show that the recognition accuracy of this algorithm is as high as 99.84%,compared with other classification methods,the recognition performance of this experimental model is better.
【Key words】:convolutional neural network;apple tree varieties;apple fruit;classification;VGG
0引言
中国是全球最大的苹果生产国,苹果作为我国四大水果之一,深受消费者喜欢[1],苹果生产对于改善生态,提高农民收入发挥了重要的作用。在我国现有苹果树二百多种[2],品种的产量、早果、丰登、抗性、储藏等特性,对于农民栽培苹果有重要的意义,栽培苹果时对于苹果品种的选取显得尤为重要。
在苹果品种的识别中,学者们有通过提取苹果的多个有效特征,如形态特征、颜色特征、纹理特征、光谱特征等,结合人工神经网络或支持向量机实现苹果品种的有效识别。近十年来,深度学习在人工智能领域取得的重要突破。它在语音识别、自然语言处理、计算机视觉、图像与视频分析、多媒体等诸多领域的应用取得了巨大成功。深度模型具有强大的学习能力和高效的特征表达能力,更重要的优点是从像素级原始数据到抽象的语义概念逐层提取信息,这使得它在提取图像的全局特征和上下文信息方面具有突出的优势,而且随着卷积神经网络,计算机能力及计算机视觉等方向的发展,基于深度学习的图像识别已经在精度和实时性方面,远远赶超传统图像。所以相比传统方法,本方法可以便捷、快速、准确的分辨苹果的品种。2014年,王丽君等提出多特征荣哥方法,实验对象是50种观叶植物,最终所采用的SVM分类器的识别率能达到91.41%[3]。2015,桂媛等以6种植物叶片作为研究对象,采用一种基于颜色和不变矩的植物叶子识别方法,最终对测试样本集的识别准确率达91.7%[4]。同年,恩德等提出基于集成神经网络的植物叶片识别方法,选择20类叶片,最终基于集成神经网络的植物叶片识别方法的平均识别精度为91%[5]。2016年许振雷等提出基于卷积神经网络的树叶识别的算法的研究,实验选取8类树叶,使用LeNet-5网络进行训练和识别,达到了92%的识别率[6]。SP Mohanty等人训练了一个深度卷积神经网络,并对其进行了迁移学习,将植物叶片病害进行分类识别,最终的识别精度为99.35%[7]。2017年,陈筱勇等提出了基于Gabor特征多分类器融合的植物叶片识别方法,实验对象是10类植物,最终得到91.7%的准确率[8]。2018年赵鹏超等采集了4种树叶,使用BP神经网络反向传播算法和随机梯度下降算法训练,识别率达到95%以上[9]。同年,张雪芹等提出了基于优化的P-AlexNet模型算法,实验对象是206类植物,最终识别类达到86.7%[10]。M Carpentier等人建立了一个包含23000张树干图片的数据库,在ResNet18和ResNet34上进行训练,识别精度达到93.88%[11]。
针对苹果品种的识别方法,本文将使用Keras深度学习框架搭建VGG16神经网络模型,对10个苹果品种进行分类识别,主要贡献体现在调整初始学习率learning_rate、调整模型输入图像的尺寸大小input_ size、调整batch_size的大小来提升苹果品种上的识别准确率。
1材料与方法
1.1试验材料
以甘肃省平凉市静宁县果树果品研究所苹果良种苗木繁育基地的十个苹果品种作为研究对象。从每个品种中选取20个长势正常的成熟苹果,共计200个。按照上下左右切斜45度等角度,将苹果摆放在背景为黑色的背板上,使用NIKON照相机拍取数据集如图1所示。具体参数如下,图片分辨率为2272×1704,色彩模式为彩色,图像格式为JPG。
1.2建模数据集方案设计
数据集是由11024张苹果果实图像组成,每个品种的图像大约在1000张,如表1所示,选取每个苹果果实图像中80%作为训练集,20%图像作为验证集。
1.3模型网络结构
VGG是Oxford的Visual Geometry Group的组提出来,该网络是在ILSVRC 2014上相关工作,主要工作是证明了增加网络的深度在一定程度上影响神经网络的最终性能。VGG有VGG16和VGG19两种结构,两者在性能上差不多,只是网络深度不一样。
VGG16网络结构简洁,由13个卷积层,最大池化层,3个全连接层和输出层构成。它相比AlexNet的改进,是采用3个3×3的卷积核代替AlexNet中的7×7卷积核、2个3×3卷积核来代替5×5卷积核,既减少参数,又进行了更多的非线性映射,可以增加网络的拟合能力。采用same padding,最大池化层的池化核为2×2,stride为2。每个通道代表着一个特征图,VGGNet网络第一层的通道数为64,后面每层都进行了翻倍,最多到512个通道,通道数的增加,使得更多的信息可以被提取出来。
1.3.1卷积层
卷积层是卷积神经网络的核心,它的作用是提取图像中最有效的特征[12]。卷积网络有3个重要结构特征:局部感受域、权值共享和下采样。采用局部感知域,权值共享降低了网络参数,保证了网络的稀疏性,防止过拟合且不损失网络学习的能力。下采样则保证模型能逐层学习全局特征直至高阶抽象形式信息。
1.3.2最大池化层
最大池化层可以减少feature map的尺寸,进而降低网络训练参数及模型的过拟合程度,池化层针对卷积后的特征图按照卷积的方法对图像部分区域求最大值,用来代表其采样的区域。为了将大的图像,不同位置的特征进行聚合统计,这个最大值就是聚合统计的办法,也就是池化[13]。
1.3.3激活函数
ReLU是目前使用最频繁的一个激活函数,ReLU首先一定程度上缓解了梯度问题(正区间);其次,计算速度非常快,这一点也可以明显比较出来;最后,ReLU加速了模型的收敛,比sigmoid与tanh要快很多。ReLU是分段线性函数,它的非线性性很弱,因此网络一般要做得很深。但这正好迎合了我们的需求,因为在同样效果的前提下,往往深度比宽度更重要,更深的模型泛化能力更好。
1.3.4全连接层
全连接层在整个卷积神经网络中起到“分类器”的作用。如果说卷积层、池化层和激活函数层等操作是将原始数据映射到隐层特征空间的话,全连接层则起到将学到的“分布式特征表示”映射到样本标记空间的作用。在实际使用中,全连接层可由卷积操作实现,对前层是全连接的全连接层可以转化为卷积核为1×1的卷积。全连接层一般有两层及两层以上,因为一层全连接层没法解决非线性问题,而两层或者以上就可以很好地解决非线性问题。
Softmax是一个数学函数,用于对0和1之间的值进行归一化。在深度学习中,Softmax作为激活函数,对0到1之间的向量中每个值的输出和尺寸进行归一化。Softmax用于分类任务,在网络的最后一层,会生成一个N维向量,分类任务重的每个类对应一个向量。
实现Softmax函数的公式:

θ(i)是我们全连接层得到的输入。公式用来计算每个类的归一化值,分子是类的指数值,分母是所有类的指数值之和。
1.3.5编译与训练
模型搭建完成后需要对模型进行编译和训练,通过调用complie方法编译学习过程,编译需要接收3个重要参数:优化函数、损失函数和性能评估。优化函数用来计算和更新影响模型训练和输出的网络参数,使其逼近或达到最优值;损失函数用来度量神经网络输出的预测值与真实值之间的误差,通过误差的反向传播知道网络参数学习;性能评估用于监控网络训练,对于分类问题,一般将性能评估指标设置为Accuracy。调用fit函数对模型进行训练,模型训练不仅需要输入数据及标签,还需要指定batch_size,epochs[14]。
1.4试验环境及模型参数设计
本试验的硬件环境:CPU为AMD Ryzen 5 2600,主频为3.40GHz,内存为16GB,显卡为2070S,显存为8GB。深度学习框架为TensorFlow 2.5.0,采用Keras 2.4.3构建和训练深度学习模型,编程语言为Python 3.7.10,编程环境为Pycharm。本研究的输入图像先设置为112×112三通道色彩,初始学习率(learning_rate)设置为0.001;批训练样本数(batch_size)设置为8;迭代次数(epochs)设置为140,每次迭代前随机打乱训练集数据;优化算法使用SGD。
网络的整体结构如图2所示。
2实验分析
2.1学习率
学习率是深度学习模型中最重要的参数,学习率过大则导致模型不收敛,过小则导致模型收敛特别慢或者无法学习。从表2可知batch_size和input_size固定不变情况下,设置batch_size为8,input_size为112,初始学习率learning_rate分别在0.1,0.01,0.001,0.0001下,查看模型训练的情况,如图3所示。由图3可以看出,初始学习率为0.001时,模型的训练效果是最好的。
2.2图像输入尺寸
图像的输入尺寸会影响模型的参数数量以及模型的性能。卷积神经网络要对图片作特征提取,而卷积神经所产生的feature map大小是和filter size、stride size相关的,假设Wout为输出特征图的大小,Win为输入特征图的大小,F为卷积核大小,stride为卷积步长,填充方式使用‘SAME’,padding为特征图填充的圈数,计算公式为
Wout=(Win+2×padding-F+1)/stride
其输出Wout由Win、filter size、padding size、stride size影响。在分类任务中,通常图片在CNN之后,是需要全连接层、输出层进行分类,那么图片过大,而卷积层较少,即浅层,那么全连接层的维度会很高,最后输出层参数会很大。如果增大filter size,stride等,那么CNN的特征提取能力则会受到限制,从VGG开始,大家就都开始用小卷积核了:小卷积核运算量小,既减少参数,又进行了更多的非线性映射,可以增加网络的拟合能力,若增大卷积核虽然可以降低最后flatten的大小,但是还是有限,且增大filter可能会降低性能。所以本实验减小图像的输入尺寸的目的有两点:(1)在不影响性能的前提下,减小运算量;(2)使得模型复杂度不至于过高,降低过拟合风险。
通过多次实验,在保持batch_size和learning_rate不变的情况下(batch_size=8,learning_rate=0.001)使用resize函数改变图像的输入大小,由于对比训练模型的准确率差距较小,故加入损失率来进行对比,结果如表2所示,可知当输入图像的大小在112×112大小时性能最佳,略好于100×100,64×64。
2.3 batch_size大小
batch_size,是进行梯度下降时每一次训练所选取的样本数量。batch_size的大小影响模型的优化程度和速度,同时其直接影响到GPU显存的使用情况,batch_size越大,占用GPU显存越大,超过GPU显存的大小,模型就无法训练。
本实验分别测试batch_size在4,8,16和32四种情形下,训练准确率曲线的变化。Learning_rate为0.001,input_size为112。如图4所示,在batch_size=4和batch_ size=8时有过拟合,而batch_size=32时有点欠拟合,当batch_size=16时性能最好。
2.4最佳模型
通过对学习率,图像输入大小,批处理参数的大小调试,在learning_rate为0.001,input_size为112,batch_ size为16时,训练出的模型性能最好。最终确定的苹果果实品种识别分类模型准确率及损失率曲线图如图5所示。在前二十次迭代过程中,其准确率上升快,损失率下降也快,在20次迭代以后,训练准确率总体上呈现出相对稳定的上升趋势。在迭代60次以后,它在Accuracy曲线和loss曲线上的特点是train_acc与val_acc和train_loss与val_loss都已经收敛并且之间相差很小。
为了保证本苹果栽培品种识别鉴定模型的可靠性和稳定性,基于上面三个最佳的参数值,并通过10倍交叉验证法来评估该模型的识别精度,得到的平均正确分类精度为99.84%,将该结果与前人的研究在苹果品种分类上的表现进行对比的结果如表3所示,本文获得的分类结果是最好的,能够达到苹果分类的要求。
3结论
苹果品种识别是机器视觉技术在农业领域的一个重要研究方向。在分析采集的苹果果实品种时发现同系的苹果之间外观差距很小,对于人来说是很难被分辨出来的,传统苹果品种识别方法需要人工提取特征,存在操作步骤复杂、识别率准确率低等缺陷。本文基于VGG16网络进行了改进,利用改进的网络模型对苹果果实品种分类的问题做了深入研究,通过分析与调试三个训练参数,并使用十折交叉验证,测试集上的准确率可达到99.81%,显著优于传统人工提取特征,整体表现较好,对于苹果品种识别具有一定的实际意义。
为了提高苹果栽培品种识别的准确率和鲁棒性,下一步工作将继续优化神经网络结构和参数,改造数据集内容,结合目标提取减小图像的尺寸大小,来构建易于训练的深度学习模型。
参考文献
[1]孙月丽.苹果砧木抗轮纹病鉴定方法及抗性砧木初选[D].保定:河北农业大学,2012.
[2]董志丹,宋尚伟,宋春晖,等.我国育成苹果品种的系谱分析及其育种启示[J].中国农业科学,2020,53(21):4485-4496.
[3]王丽君,淮永建,彭月橙.基于叶片图像多特征融合的观叶植物种类识别[J].北京林业大学学报,2015,37(1):55-61.
[4]桂媛.基于SVM的植物叶片类别识别研宄[J].信息技术与信息化,2015(9):148-150.
[5]恩德,忽胜强.基于集成神经网络的植物叶片识别方法[J].浙江农业学报,2015,27(12):2225-2233.
[6]许振雷,杨瑞,王鑫春,等.基于卷积神经网络的树叶识别的算法的研究[J].电脑知识与技术,2016,12(10):194-196.
[7]MOHANTY S P,HUGHES D P,SALATHE M.Using Deep Learning for Image Based Plant Disease Detection[J].Frontiers in Plant Science,2016(7):1419.
[8]陈筱勇,马兰.基于Gabor征多分类器融合的植物叶片识别方法[J].光学与光电技术,2017,15(6):24-28.
[9]赵鹏超,戚大伟.基于卷积神经网络和树叶纹理的树种识别研究[J].森林工程,2018,24(1):56-69
[10]张雪芹,陈嘉豪,诸葛晶晶,等.基于深度学习的快速植物图像识别[J].华东理工大学学报(自然科学版),2018,44(6):887-895.[11]CARPENTIER M,GIGUERE P,GAUDREAULT J.Tree Species Identification from Bark Images Using Convolutional Neural Networks[J].IEEE/R SJ International Conference on Intelligent Robots and Systems,2018:1075-1081.
[12]Feng J,Darrell T.Learning the structure of deep convolutional networks[C]//IEEE International Conference on ComputerVision.IEEE Computer Society,2015:2749-2757.[13]杨静亚,李景霞,王振宇,等.基于卷积神经网络的花朵品种的识别[J].黑龙江大学工程学报,2019,10(4):90-96.
[14]徐岩,刘林,李中远,等.基于卷积神经网络的玉米品种识别[J].江苏农业学报,2020,36(1):18-23.
[15]张力超,马蓉,张垚鑫.改进的LeNet-5模型在苹果图像识别中的应用[J].计算机工程与设计,2018,39(11):3570-3575.
[16]岳有军,田博凯,王红君,等.改进VGG模型在苹果外观分类中的应用[J].科学技术与工程,2020,20(19):7787-7792.
[17]李敏.不同产地苹果的近红外光谱分类识别法[J].红外,2014,35(12):41-44.
关注SCI论文创作发表,寻求SCI论文修改润色、SCI论文代发表等服务支撑,请锁定SCI论文网!
文章出自SCI论文网转载请注明出处:https://www.lunwensci.com/jisuanjilunwen/40990.html