SCI论文(www.lunwensci.com):
摘要:基于深度学习在图像分类领域的优异性能,提供一个包含多个苹果品种原始数据集,通过使用ResNet50、InceptionV3以及DenseNet121预训练模型进行苹果品种识别分类,对比3种模型的准确性、泛化能力和稳定性,以期为推进苹果产业标准化、规模化、智能化生产提供理论依据和技术支持。以甘肃省平凉市静宁县果树果品研究所苹果良种苗木繁育基地作为实验基地,采集7个品种共7763幅苹果果实图像自建数据集,进而利用神经网络建立分类识别模型。实验结果验证了卷积神经网络在苹果品种图像识别任务上的优越性能,测试集上表现较优的ResNet50识别准确率达到98.44%,验证了本文方法基于苹果果实进行品种识别与鉴定的有效性。
关键词:图像分类;苹果品种;卷积神经网络;预训练;深度学习
Research on Apple Fruit Variety Identification and Recognition Based on Deep Learning
MA Bin,HAN Junying
(College of Information Science and Technology Gansu Agricultural University,Lanzhou Gansu 733070)
【Abstract】:Based on the excellent performance of deep learning in thefield of image classification,we provide a raw dataset containing several apple varieties,and compare the accuracy,generalization ability and stability of the three models by using ResNet50,InceptionV3 and DenseNet121 pre-trained models for apple variety recognition and classification,in order to promote the standardization,scale and intelligence of apple industry.This study aims to provide theoretical basis and technical support for promoting standardized,large-scale and intelligent production in apple industry.A total of 7763 apple fruit images of 7 varieties were collected from the apple seedling breeding base ofJingning County fruit tree and fruit research institute in Pingliang City,Gansu Province as the experimental base,and then a classification recognition model was established using neural networks.The experimental results verified the superior performance of convolutional neural networks for apple variety image recognition task,and the recognition accuracy of ResNet50,which performed better on the test set,reached 98.44%,which verified the effectiveness ofthis paper's method for variety recognition and identification based on apple fruits.
【Key words】:image classification;apple variety;convolutional neural network;pretrained;deep learning
0引言
我国是世界上最大的苹果生产和消费大国,但是苹果的种类非常多,而且部分苹果外观差异不大,但价格相差较多,相关专业人员也很难辨别清楚,难以在采摘后在流水线上快速鉴别,目前的苹果产业仍属于劳动密集型产业,需要大量人工来进行采摘、分类工作[1],极大的制约了苹果产业的规模化和智能化生产经营,所以研究一种智能化、高效的苹果品种识别方法对于苹果产业显得尤为重要,随着机器视觉技术的高速发展,通过果实图像识别果实品种的方法越来越多的被应用于水果分类中,用来取代人工作业,并取得了丰硕的成果[2]。
深度学习是机器学习领域中的一个重要研究方向,近年来无论是理论还是应用方面都取得了极大的发展,其最终目标是让机器模拟人的思维具有学习分析能力,识别图像、文字、声音等数据[3]。尚静[4]等基于可见/近红外光谱技术实现了苹果品种的无损识别,在预测集样本上正确识别率高达100%。雷欢[5]等基于多特征融合与SVM实现了苹果品种快速识别算法,在测试集上平均准确率达94.0%。邹小波[6]等使电子鼻来区分不同品种苹果气味,收集气体传感器的数据,利用多尺度小波分析进行处理,使用支持向量机建立识别模型,在花牛苹果的识别正确率上达到了100%,对姬娜和富士的识别率大于90%。仇誉[7]等通过对多个苹果果树品种的叶片图像数据集建立卷积神经网络识别分类模型,在测试集的准确率达到了90.49%。王丹丹[8]等设计了基于ResNet-44的R-FCN,提出基于区域的全卷积网络的苹果目标识别方法,其识别准确率为95.1%。张力超[9]等采用了改进后的LeNet5,在红富士和红元帅的分类识别上,准确率达到了93.7%。
本文以7763张苹果果实图片共7个苹果品种作为研究对象,基于卷积神经网络训练识别设计分类模型。对ResNet50[10]、InceptionV3[11]、DenseNet121[12]共3种经典卷积神经网络进行比较,以期为基于苹果果实进行苹果品种识别提供理论参考依据。
1材料与方法
1.1试验材料与试验平台
所有实验数据集用到的原始苹果果实图像均来自甘肃省平凉市静宁县果树果品研究所基地,采用数码相机拍摄,总共采集7个品种共7763张苹果果实图片,详细数据如表1所示。部分苹果图像如图1所示。实验所用平台为自有服务器,开发平台为Windows Server 2012 R2 Standard操作系统上的Tensorflow深度学习框架,使用Python语言编写。参数详细配置如表2所示。
1.2方法
1.2.1数据增强
由于试验中苹果果实图片数据集样本较少,但神经网络需要大量的数据样本进行训练,所以需要对现有图片数据进行数据增强,同时为了提高卷积神经网络的泛化能力,降低过拟合,采用Keras的ImageDataGenerator对苹果果实样本进行数据增强,具体采取的图像增强方式为:对现有图像进行40°以内随机旋转,垂直和水平位移20%,剪切和缩放20%,水平翻转,填充像素规则为用离其最近的像素点做填充,所有增强方法以相同的概率随机进行。每一次给模型生成batch_size(64)张样本数据,每个模型累计扩充了31余万张苹果果实样本。本文采用几何变换进行图像增强,模拟现实情况不同角度抓取果实图片,增加了图片样本集的空间抽样覆盖度,在扩充样本数据集的同时,不改变图片实际的内容,保证场景真实性,提升深度学习模型的鲁棒性[13]。部分增强后图像如图2所示。
1.2.2数据集划分
本文将每个品种按8:1:1的比例分割为训练集、验证集以及测试集。统计数据如表3所示。
1.2.3模型
ResNet50为了解决梯度消失,深层网络难训练的问题,使用了残差连接提起残差特征,作为该层输入中学习特征的减法。将靠前若干层的某一层数据输出直接跳过多层引入到后面数据层的输入部分。意味着后面的特征层的内容会有一部分由其前面的某一层线性贡献,解决了传统卷积层或全连接层在信息传递时存在的丢失、损耗问题[14]。残差模块如图3所示。
Inception V3引入Inception模块,采用多层3×3小卷积核,还引入了将一个较大的二维卷积拆成两个较小的一维卷积的做法,这种非对称的卷积结构拆分在处理更多、更丰富的空间特征以及增加特征多样性等方面的效果能够比对称的卷积结构拆分更好,并且减少计算量,最终拼接不同尺度使特征融合[15]。InceptionV3模块如图4所示。
DenseNet121主要是将每一层的输出都导入到后边所有的层,与ResNet相加不同的是,DenseNet使用的是连接结构,这样的结构可以减少网络参数,避免了可能出现的某些层被选择性丢弃或者信息阻塞等,产生的问题是后面层的输入会非常大,DenseNet内部采用瓶颈层来减少计算量,在原有的结构中增加1×1卷积层来降低特征数量,从而提升计算效率[16,17]。DenseNet121模块结构如图5所示。
模型改进是在全连接层前增加了批归一化,以期加速网络收敛速度,提高网络模型的泛化能力,防止过拟合。
1.2.4损失函数
苹果品种识别属于多分类任务,本文采用交叉熵损失函数作为模型的损失函数,用于评估真实概率分布与预测概率分布之间的差异。交叉熵的值越小,模型预测效果就越好,在采用Softmax分类器输出每个类别的分类概率时,使其多个分类的预测值和为1,再通过交叉熵来计算损失。
1.2.5模型评价指标
评价模型训练情况采用了验证集和测试集上的分类准确率(Accuracy)和损失函数值(Loss)为评价指标。准确率越高,损失值越小,模型学习效果越好。同时以测试集上的结果为准,来对比模型泛化能力的好坏和鲁棒性的强弱。
2试验结果与分析
2.1超参数选取
批尺寸设置为64,试验过程中,只在训练集上对苹果果实图片进行图像增强,同时,为了保证试验结果的准确性,验证集和测试集不做图像增强。3种卷积神经网络采用各自默认像素的输入图像,即ResNet50将增强后的图像规范化至224×224像素的输入图像,InceptionV3为299×299像素,DenseNet121为224×224像素。在试验中使用优化器进行对比,最终为每个神经网络选择表现较好的优化器,其中ResNet50没有使用传统的Adam,而是采用SGD优化器,学习率为0.01,InceptionV3采用的优化器为RMSprop优化器,学习率为0.001,DenseNet121采用的优化器为Adam,学习率为0.001。实验中进行了51轮迭代。
2.2训练集和验证集测试结果
随着迭代次数的增大,各模型的分级准确率整体呈上升趋势,损失值整体呈下降趋势。在迭代20轮后,训练集准确率和验证集准确率均保持在94%以上,ResNet50和DenseNet121展现出的性能略优于InceptionV3,在迭代过程中准确率曲线较为稳定。ResNet50和DenseNet121损失值在25轮起不再产生明显变化,未发现明显过拟合情况,InceptionV3损失值曲线震荡,有轻微过拟合出现。
2.3测试集测试结果
如表4所示,试验中使用预先按比例分好的测试集,最终结果ResNet50的准确率为98.44%,损失值为0.05758。准确率高于其他模型,损失值低于其他模型,表现出较好的泛化能力以及较强的鲁棒性。
3结语
本文采用卷积神经网络建立基于苹果果实图像的苹果品种分类模型,以期用于自动采摘等苹果产业化智能化手段提供技术支持和理论依据。总共使用了7个品种共7763幅苹果果实图像,基于ResNet50、InceptionV3、DenseNet121神经网络模型进行迁移学习,其中最优结果为ResNet50,在测试集上达到了98.44%的识别准确率且损失值较小,其表现优于预训练的InceptionV3和DenseNet121,且稳定性和准确性均有提升,对基于苹果果实进行苹果品种分类具有一定的参考意义。
参考文献
[1]王洪煜,张复宏,宋晓丽.我国苹果生产现状与经济效益分析[J].对外经贸,2017(10):93-96.
[2]文馗.基于深度学习的图像识别方法研究与应用[D].武汉:华中师范大学,2017.
[3]袁培森,黎薇,任守纲,等.基于卷积神经网络的菊花花型和品种识别[J].农业工程学报,2018,34(5):152-158.
[4]尚静,张艳,孟庆龙.可见/近红外光谱技术无损识别苹果品种的研究[J].保鲜与加工,2019,19(3):8-14.
[5]雷欢,焦泽昱,马敬奇,等.基于多特征融合与SVM的苹果品种快速识别算法[J].自动化与信息工程,2020,41(4):13-17.
[6]邹小波,赵杰文.基于小波去噪和支持向量机的苹果品种识别法[J].仪器仪表学报,2007(3):534-538.
[7]仇誉,韩俊英,封成智,等.基于卷积神经网络的苹果栽培品种识别[J].计算机与现代化,2021(12):65-71.
[8]王丹丹,何东健.基于R-FCN深度卷积神经网络的机器人疏果前苹果目标的识别[J].农业工程学报,2019,35(3):156-163.[9]张力超,马蓉,张垚鑫.改进的LeNet-5模型在苹果图像识别中的应用[J].计算机工程与设计,2018,39(11):3570-3575.
[10]HE K M,ZHANG X Y,REN S Q,et al.Deep residual learning for image recognition[C]//Proceedings ofthe IEEE Conference on Computer Vision and Pattern Recognition,2016:770-778.
[11]SZEGEDY C,VANHOUCKE V,IOFFE S,et al.Rethinking the inception architecture for computer vision[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition,2016:2818-2826.
[12]HUANG G,LIU Z,WEINBERGER K Q,et al.Densely Connected Convolutional Networks[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition,2017:4700-4708.
[13]何进荣,石延新,刘斌,等.基于DXNet模型的富士苹果外部品质分级方法研究[J].农业机械学报,2021,52(7):379-385.
[14]刘晨,赵晓晖,梁乃川,等.基于ResNet50和迁移学习的岩性识别与分类研究[J].计算机与数字工程,2021,49(12):2526-2530+2578.
[15]李珍辉,鲁静文,陈镜伊,等.基于InceptionV3卷积神经网络森林火灾检测方法[J].湖南工程学院学报(自然科学版),2021,31(4):44-49.
[16]赵辉,曹宇航,岳有军,等.基于改进DenseNet的田间杂草识别[J].农业工程学报,2021,37(18):136-142.
[17]叶佳超,钟宝荣.基于DenseNet的COVID-19 CT图像识别[J].电脑知识与技术,2021,17(25):106-108.
关注SCI论文创作发表,寻求SCI论文修改润色、SCI论文代发表等服务支撑,请锁定SCI论文网!
文章出自SCI论文网转载请注明出处:https://www.lunwensci.com/jisuanjilunwen/41842.html