SCI论文(www.lunwensci.com)
摘 要:为解决农业装备制造企业供应链峰谷生产下因库存需求预测不准造成的“断供”或库存冗余问题,且传统的预测 模型不能够考虑影响库存的多重因素,预测结果往往不够准确,因此决定建立一个可以精准预测的模型。提出一种基于 LSTM 算法的农业装备库存预测模型,可根据影响库存的主要影响因素等数据实现精准预测,能够最大程度地节约成本,提高效率。 实验结果表明 :LSTM 模型的预测数据集和真实数据集的拟合度较高,这说明 LSTM 模型预测结果具有更高的预测精度,有很 强的泛化能力。
Research on Agricultural Equipment Inventory Prediction Based on Deep Learning
CHAI Fubo1. ZHANG Leilei2. SU Jianxin1. LI Fengjun2. GAO Ming2. LV Feng1. ZHANG Bingbing2. ZHAO Changwei3
(1.School of Mechatronics Engineering, Henan University of Science and Technology, Luoyang Henan 471003;
2.First Tractor Company Limited, Luoyang Henan 471004;
3.College of Information Engineering, Henan University of Science and Technology, Luoyang Henan 471023)
【Abstract】: In order to solve the problem of "supply cut" or inventory redundancy caused by inaccurate inventory demand prediction in the peak and valley production of supply chain of agricultural equipment manufacturing enterprises, and the traditional forecasting model can not take into account the multiple factors affecting inventory, so the prediction results are often not accurate, so it is decided to establish a model that can accurately predict. A prediction model of agricultural equipment inventory based on LSTM algorithm is proposed, which can realize accurate prediction according to the main influencing factors of inventory and other data, and can save cost and improve efficiency to the greatest extent. The experimental results show that the prediction data set of LSTM model has a high degree of fitting with the real data set, which indicates that the prediction results of LSTM model have higher prediction accuracy and strong generalization ability.
【Key words】:inventory;accurately predict;forecasting model;LSTM algorithm
0 引言
库存即企业处于存储状态的物资,也是一个企业资 源的总和 [1]。储备库存是为了满足企业在后续阶段的市 场需求或者客户预定时能有充足的货源来进行供给,在 满足企业利益的前提下,对下一阶段用于流通的或使用 的物品进行储备 [2]。顾名思义,库存控制是在企业自身经营效力的前提下,针对下一阶段用户的需求对库存商 品进行动态化调整。通常意义上,库存控制的目标是尽 可能减少货物冗余堆积 [3],同时也让企业拥有充足的货 源来进行下一阶段的生产调整,以提高整个公司的运行 效率,使得企业经营拥有更大的竞争力。
由于农业装备产品需求的季节性,生产高峰月份与生产低谷月份的产量差别巨大,为应对峰时生产,需要 对一些制造周期长、结构复杂的定制零部件提前建立 “储备库存”,这种库存不同于普通供应链管理中由订单 拉动的库存,其影响因素虽然与当前订单量有关,但更 多取决于多因素预测或博弈结果。针对这一问题,通过 深入分析影响需求的各种因素,运用大数据分析和人工 神经网络算法,建立农业装备峰谷生产“储备库存”的 网络协同动态预测方法,解决农业装备峰谷生产“储备 库存”预测不准确造成的高峰生产期“断供”或过多库 存造成的损失。
农业装备企业库存具有较明显季节性、周期性变 化,对其作库存预测是有必要的。农业装备企业的库存 预测是个时间序列的预测问题。由于数据序列往往是非 线性的,使得用统计学时间序列模型的传统方法较难解 决,而机器学习的方法非常灵活,可建立各类特征模型 解决问题,但人工特征工程费时、费力,限制了这项技 术的推广 [4]。
深度学习技术,相对于传统技术而言,可以自动将 有效特征从大量的原始数据中抽取出来,因此其使用性 更强 [5]。LSTM 时间递归神经网络, 在预测和处理时间 序列的间隔和延迟相对更长的重要事件中具有合适性的 特征 [6]。
1 预测模型
1.1 RNN 和 LSTM
循环神经网络 [7] (RNN,Recurrent Neural Networks) 用于处理序列数据。RNN 中一个序列当前的输出与前 面的输出也有关。具体的表现形式为网络会对前面的信 息进行记忆并应用于当前输出的计算中,即隐藏层之 间的节点不再无连接而是有连接的,并且隐藏层的输入 不仅包括输入层的输出还包括上一时刻隐藏层的输出。 理论上, RNN 能够对任何长度的序列数据进行处理。 RNN 的网络结构见下图 1.
长短期记忆网络也叫循环神经网络 [8]。在时间序列 预测中, RNN 使用频率较高,是一种预测和处理系列 数据的专用神经网络 [9]。循环神经网络自身存在着梯度 消失和爆炸的问题等 [10]。LSTM[11] 是一种特殊的 RNN, 作为 RNN 的变种,其可以避免这些问题。
LSTM 即长短时记忆网络,可以解决长期依赖的问 题 [12],其使用门控结构来控制长期状态信息 [13]。相较 于一般 RNN 只拥有一个传递状态 h^(),LSTM 拥有 两个传递状态 a^() 和 c^(),a^() 相当于 RNN 中的 h^(),在不同节点下会有很大差别,但 c^() 改变较慢,可以实现长时记忆。LSTM 拥有三个“门” 结构,分别是遗忘门(forget gate)、输入门 / 更新门 (update gate) 和输出门(output gate), 当门打开时 (sigmoid 层输出为 1),信息被允许通过,当门关上时 (sigmoid 层输出为 0),信息不被允许通过。三个门的 作用分别如下 :
遗忘门 :控制是否忘记之前没有用的信息 ;
输入门 :控制是否忘记部分之前时刻的状态后,从 当前时刻的输入补充最新的记忆 ;
输出门 :在计算得到新的状态 c^() 后需要产生 当前时刻的输出。
LSTM 的神经元结构图见图 2 :
tanh :一种用于循环神经网络的激活函数
softmax :一种用于 k 类别分类问题的激活函数
经过上述公式控制过程,可以构建出可以捕获深层 连接的神经网络。
1.2 LSTM 模型
LSTM 农业装备预测模型包含数据序列输入层、隐 藏层、预测输出层和网络训练,如图 3 所示。
1.2.1 输入层数据处理
实际生活中有较多因素影响着农业装备库存量,选 取其中的比较重要的七种因素作为影响因素,分别是第 一产业人员从业数量、农村居民可支配收入、小麦价 格、玉米价格、柴油价格、播种面积与补贴额。
选取的 7 个主要影响因素就是一条样本数据中的 7 个特征,记作X = {x1 , x2 , x3 , x4 , x5 , x6 , x7 },预测的目标值 农业装备库存量是一条样本数据中的标签, 记作 Y。数 据流程图见图 4.
数据输入 :通过 pandas 库读取样本数据的 csv 文件 ;
数据预处理 :数据预处理是为了降低缺失数据或异常数据对选取的训练数据所造成的影响,将空值或异常 值进行清洗并处理,通常是以本列的平均值代替 ;
数据特征提取 :影响农业装备库存量的 7 个主要因 素已经选出,即作为影响最终目标值的 7 个特征 ;
数据归一化 :其主要目标是减少计算,加快模型的 训练速率。样本数据中的数值过大,不利于计算,通过 对其进行相关处理,将其值限制在 [0 , 1] 之间,这样可 以加快模型的收敛速度。归一化的计算方法如下面公式(1) 所示,
公式中的 MaxValue 和 MinValue 分别是对应对每 一字段数据的最大值和最小值, x 是字段具体数值, y
则是每一字段数据归一化之后的最终结果。选用不同的 激活函数,可以选择将数据限制在不同的区间之中。
划分数据集 :按照一定比例或一定量的数据进行 划分。
1.2.2 评价指标
预测模型的网络训练是在隐含层中完成的。在农业 装备库存量模型的输入层中已经得到了原始样本数据, 并对这些数据进行了数据预处理、数据归一化、数据特 征提取与划分数据集的相关操作。在隐藏层中对处理之 后、划分好的训练集与测试集分别进行训练的到训练之 后的训练集与测试集。将训练前后的训练集与测试集之 间作对比可以得到相关的误差。根据模型评价指标(由 误差分析得出)可以判断模型的精确度。常用的模型评价指标有均方根误差、平均绝对误 差、平均绝对值百分比误差和决定系数等。
(1) 均方根误差 RMSE(Root Mean Square Error)。
与 MSE 相比,RMSE 可以降低误差的级别,RMSE 的值越小,说明模型越有意义,它的计算公式如下式 (2) 所示 :
(2) 平均绝对误差 MAE(Mean Absolute Error)。
MAE 的单位和 RMSE 的一致,它的计算公式如下 式 (3) 所示 :
(3) 平均绝对值百分比误差 MAPE(MeanAbsolute Percentage Error)。
平均绝对值百分比误差的取值在 [0. + ∞), 通过 式 (4) 可以计算得到,其值越小表明模型越精确。
(4)决定系数 R2 (Coefficient of Determination)。
决定系数也称为拟合优度, 通常用来衡量模型能否很 好地描述真实数据的变化,它的计算公式如式 (5) 所示 :
其中, y 是样本输出的均值。
LSTM 模型中超参数的取值对预测结果的准确性有 非常大的影响。影响 LSTM 模型的超参数包括学习率、 迭代次数、网络层数、隐藏层节点数和 Dropout 率等。
通过调整这些参数可以改变模型的精确度。
2 实验结果与评价
模型构建是分析处理数据的桥梁,测试则是对模型 的检验和优化,本文首先以神经网络搭建框架为基础, 通过 LSTM 模型对训练数据集的学习,获得模型的相 应参数 ;然后在测试集上进行测试 ;最后采用相关评价 指标评价模型的预测性能。
2.1 模型参数设置
参数设置是模型构建的核心,通过合理的设定模型的 相关参数,可以得到一个最合适的模型。实验利用模型预 测性能评估反馈方法,初始数据共 500 条,设定模型参数 为 :LSTM 输入层隐含层神经元数量为 32.激活函数为 relu,损失度量函数为均方误差 MSE,迭代次数为 1000 次,每批次处理 600 个样本数据块, Dropout=0.1. 自 适应学习率优化算法为 Adam。
2.2 测试结果评价
对模型性能程度的评价指标有很多,其中损失函数 MSE 是一种比较常用的损失函数,均方根误差 RNSE 是预测值与实际值偏差平方的数学期望开方,能够很好 地反映预测的精确度, R2 为度量预测对象由影响因子解 释的程度,其数值介于 0 ~ 1 之间,越接近 1.表示模 型预测拟合程度越好。不同的评价指标,代表的侧重方 向往往不同,选取多个评价指标可以对模型的性能有更 全面的认识,因此本次实验采用损失函数 MSE、RMSE 及 R2 确定系数作为模型预测性能的评价指标。
从上图 5 可以看出,随着模型优化目标参数的调整, 学习迭代次数的增加,训练和测试集预测归一化数据的 Loss 误差值逐渐减小, 并于 epochs=600 时趋于收敛, 此时,MSE=0.0046、RMSE=0.0681、R2=0.967.
图 6 和表 1 实验结果表明,模型的评价 RMSE 误 差值相对较小, R2 确定系数在训练集和测试集上分别是0.967 和 0.913.预测数据与实际数据拟合度较高,模 型的预测和泛化能力较强。
3 结论
通过深入分析影响需求的各种因素,运用大数据分 析和人工神经网络算法,建立一套结合农业装备制造企 业特点的基于原材料价格预测的农业装备峰谷生产储备 库存的智能优化方法,解决农业装备峰谷生产储备库存 预测不准确造成的高峰生产期“断供”或过多库存造成 的损失。
完成了农业装备库存的预测研究,提出了基于 LSTM 算法的农业装备库存预测模型,可以根据影响库存的主 要因素确定未来库存量。这在最大限度上节约了材料成 本,并提高了农业装备库存预测的精准度。
目前本文所使用的历史作业数据量较少,为了提升 模型的预测精度,下一步将继续增大训练数据规模 ;单 一模型的预测效果通常没有复合模型好,下一步将把 LSTM 与其它模型进行相结合,提出性能更好的模型。
参考文献
[1] 丁小晏.浅谈制造企业库存管理优化[J].中国集体经济, 2022(26):53-55.
[2] 彭志忠.基于神经网络的供应链安全库存预测模型[J].管理 现代化,2006(3):28-30.
[3] 何佳,王子牛,罗刚,张楠.基于混沌神经网络技术的安全库存 预测研究[J].计算机技术与发展,2007(8):247-249+253.
[4] 柯苗,黄华国.基于LSTM神经网络的电商商品销售预测方法 [J].福建师大福清分校学报,2020(5):83-89.
[5] Bengio,Yoshua,Courville,et al.Representation Learning: A Review andNew Perspectives[J].IEEETransactions on Pattern Analysis&MachineIntelligence,2013.35(8):1798-1828.
[6] 赵军豪,李玉华,霍林,等.融合微博情感分析和深度学习的宏 观经济预测方法[J].计算机应用,2018.38(11):3057-3062.
[7] 吕光,张丹,刘作林.基于RNN模型的公园景观设计与造价预 测分析研究[J].计算智能与神经科学,2022.
[8] 赵一秾,李若熙,曹语含,等.双流卷积网络工人异常行为识别 算法研究[J].辽宁科技大学学报,2019.42(4):301-308.
[9] 李洁,林永峰.基于多时间尺度RNN的时序数据预测[J].计算 机应用与软件,2018.35(7):33-37+62.
[10] 白秋产.基于物联网的农田智能灌溉系统[J].江苏农业科学, 2017.45(22):247-251.
[11] Alex Graves.Supervised Sequence Labelling with Recurrent Neural Networks[M].Springer,Berlin, Heidelberg: 2012.
[12] 刘鑫.一种基于LSTM的机器阅读理解模型[J].电子设计工 程,2021.29(11):166-170.
[13] Greff K,Srivastava R K,J Koutník,et al.LSTM:A Search Space Odyssey[J].IEEE Transactions on Neural Networks & Learning Systems,2016.28(10):2222-2232.
关注SCI论文创作发表,寻求SCI论文修改润色、SCI论文代发表等服务支撑,请锁定SCI论文网!
文章出自SCI论文网转载请注明出处:https://www.lunwensci.com/jisuanjilunwen/58124.html