SCI论文(www.lunwensci.com):
摘 要:近年来我国二手车市场蓬勃发展,但传统二手车价格评估方法选取指标单一,过度依赖评估人员主观判断,难以 胜任当前评估工作,现行市场亟需一种客观、准确、高效的二手车价格评估方法。本文提出影响二手车价格的 8 个评估参数, 基于 BP 神经网络建立二手车价格评估模型,并使用遗传算法优化网络的权值和阈值,进一步提高网络的预测精度。该模型一 定程度上克服了传统评估方法的不足,为当前二手车价格评估方法提供参考。
关键词:遗传算法 ;BP 神经网络 ;二手车 ;价格评估
Application of BP Neural Network Optimized by Genetic Algorithm in Second- hand Car Price Evaluation
LI Fang, MIN Yongjun
(College of Automotive and Traffic Engineering, Nanjing Forestry University, Nanjing Jiangsu 210037)
【Abstract】: In recent years, Chinas second-hand car market has developed vigorously, but the traditional second- hand car price evaluation method has single selection index and excessively relies on the subjective judgment of appraisers, which is difficult to be competent for the current evaluation work. The current market is in urgent need of an objective, accurate and efficient second-hand car price evaluation method. In this paper, eight evaluation parameters affecting the second-hand car price are proposed, the second-hand car price evaluation model is established based on BP neural network, and the weights and thresholds of the network are optimized by genetic algorithm to further improve the prediction accuracy ofthe network. To some extent, this model overcomes the shortcomings oftraditional evaluation methods and provides reference for current second-hand car price evaluation methods.
【Key words】: genetic algorithm;BP neural network;second-hand car;price evaluation
0 引言
现阶段我国二手车交易市场日益活跃,2020 年二手 车交易量达到 1434 万辆,新车销售量 2531 万辆 [1]。美 国、德国等汽车市场成熟国家的二手车销量均大于新车销量,我国的二手车市场仍具有很大发展潜力 [2]。但我国二手车价格评估方法还停留在 20 世纪初,存在选取指标单一,耗费人力大,过度依赖评估人员主观判断等诸多不 足,随着二手车电商平台的发展,其透明性、客观性、准 确性、公正性已不能满足二手车市场健康发展的需要。
为克服传统二手车价格评估方法的不足,近年来已提出多种评估方法 :张远森 [3] 使用 BP 神经网络对二手 车价值评估,并基于多元线性回归方法对模型评估。吕 劲 [4] 使用支持向量机的方法对二手车价格进行评估。王 静娜 [5] 基于随机森林算法构建二手车价格评估模型,并对决策树、神经网络、多元线性回归等多种模型进行 了比较。一些学者基于 BP 神经网络建立评估模型,但BP 神经网络梯度下降法容易陷入局部最优值,难以得 到全局最优值,并且会增加预测误差 [6-8]。
遗传算法是模仿自然界中生物择优进化而得出的模 型,由于其可扩展性强,具有良好的全局搜索能力,近年来广泛应用于机器学习的参数优化和最优值求解等问题。本文基于 BP 神经网络建立二手车价格评估模型,使用遗传算法优化 BP 神经网络的权值和阈值,一定程度上克服了 BP 神经网络收敛于局部最优值的缺点,并使用样本对比优化前后的预测误差,证明遗传算法优化的有效性。
1 BP 神经网络
1.1 BP 神经网络基本结构
BP (Back Propagation) 神经网络是由输入层、输出层和隐藏层组成的多层前馈网络,每层有数量不等的神经元。传统 BP 神经网络隐藏层的数量一般为 1-3 层不等,其中单隐藏层 BP 神经网络应用最为广泛。
其基本结构如图 1 所示,输入层、隐藏层和输出层分别由 n、h、m 个神经元组成, w
ij 和 v
jk 分别为输入层第 i 个神经元对应隐藏层第j 个神经元和隐藏层第j 个神经元对应输出层第 k 个神经元的权值, θ
1j 和 θ
2k 分别为隐藏层第j 个神经元和输出层第 k 个神经元的阈值。
1.2 BP 神经网络原理
BP 神经网络原理可总结为 :通过信号前向传播和误差反向传播,不断修正权值和阈值,使输出结果的均方误差达到最小。
信号前向传播阶段 :信号通过 BP 神经网络中激活函数 f
i(x) 经隐藏层至输出层,输入层与隐含层激活函数常用单极性 Sigmoid 函数,该函数可将变量映射到[0,1],便于神经网络计算,其表达式如下 :
隐含层与输出层激活函数常用纯线性的 purelin 函 数,即输入等于输出。以隐藏层第j 个神经元为例,f
1(x) 为输入层与隐藏 层之间的激活函数,其输出为 :
f
2(x) 为隐藏层至输出层的激活函数,则输出层第 k 个神经元输出为 :
(2)误差反向传播阶段 :通过误差逆向传播将 E 降 至最小,以梯度下降法更新各神经元的权值和阈值 :
其中 t
k 为样本实际值,z
k 为神经网络输出值。以 w
1i 更新为例 :
其中 w
1i(n+1) 为第 n+1 次更新后的权值,∆w
1i(n) 为以梯度下降法得到的修正值, η 为学习速率,阈值修正同理。
2 遗传算法
遗传算法 (GeneticAlgorithm,GA) 最早是由美国John holland 于 20 世纪 70 年代提出,受达尔文进化论中物 竞天择和生物遗传的启发,将数据编码为种群个体内染 色体中的基因,并模仿自然界中基因选择,交叉,变异, 以适应度值确定其寻优程度,是机器学习中常用的全局 搜索式的优化方法,可用于优化神经网络结构(隐藏层 数,隐藏层神经元数)和参数(权值和阈值),本文基 于遗传算法优化 BP 神经网络参数流程如图 2 所示 [9-10]。
2.1 种群初始化
种群初始化编码有二进制编码和实数编码两种,二 进制编码使用固定长度的二进制字符串表示个体,但可 能存在编码长度过长,局部搜索能力较差的问题,为保 证精度并扩大搜索范围,本文采用了实数编码的方式, 每一个体编码为实数串,表示了神经网络中所有权值和 阈值,如图 1 所示 :输入层、隐藏层和输出层分别由n、h、m 个, 则权值个数为 q=n×h+h×m 个, 阈值 为 o=h+m 个,则染色体编码长度为 q+o 个。
2.2 适应度函数
适应度代表个体在自然界中适应环境的能力,其值 越大,该个体适应自然能力越强,遗传给下一代的概率越 大。适应度函数的选取需要结合具体问题进行选择调整, 本文基于预处理后训练集的数据,记录训练后 BP 神经网络预测值误差的平方和,将其倒数记为 F(x),k 为常数。
2.3 选择、交叉、变异操作
(1)选择 :遗传算法常用选择方法有 :锦标赛选择 法,轮盘赌法,随机遍历抽样法。本文选择轮盘赌法, 其核心思想是 :某个体被选中遗传到下一代的概率与其 适应度大小成正比,这也符合遗传算法的思想,第 j 个体被选中的概率 P
j 如下。
其中 F(j) 为第j 个个体的适应度,

为所有个体适应度之和。
(2)交叉 :由于使用实数编码,本文采用算术交叉 法(Arithmetic Crossover):由两个个体的线性组合 而产生出两个新的个体,以实现种群多样性并改善算法 性能,如第j 个染色体与第 k 个染色体在 i 位交换基因规则如(9)所示,交叉概率 b 范围为 [0,1]。
(3)变异 :选取第 i 个个体中第j 个基因 aij 进行变 异操作,本文基因变异规则以第 j 个个体染色体中第 i 个基因 a
ji 为例,如(10)所示。基因变异可能会产生 适应度更高的个体并遗传给下一代,以提高遗传算法寻
优范围,常用变异概率为 [0.01,0.1][11]。
其中 :
a
min 与 a
max 为基因 a
ji 的上下界, r 为 [0,1] 之间的随 机数,c 为随机数,g 为当前进化次数, G 为最大进化次数。
3 GA-BP 模型
3.1 GA-BP 模型构建
(1)输入层、输出层神经元个数确定 :传统二手车 评估方法主要问题在于仅使用年限或里程这类单一项指标 决定二手车的价格,这种方法严重忽略了二手车其他因素 对二手车价格的影响,因此本文充分考虑二手车价格的影 响因素,确定了排放标准、迁入地区、行驶里程、使用年 限、车型、发动机功率、发动机排量、新车价格 8 个关 于二手轿车价格评估参数,以此作为神经网络输入,即 n=8,二手车最终成交价作为神经网络输出, 即 m=1。
(2)隐藏层个数确定 :隐藏层中神经元数量的选取 对神经网络训练与预测效果至关重要,神经元数目过 少,网络学习评估能力较差,产生欠拟合 ;神经元过多 会增加神经网络复杂程度并导致过拟合。目前,隐藏层 中神经元数量的选取尚无通用的定理,本文参考经验公 式,其中 a 为 1-10 的常数,通过多次调整 a 的数值, 训练比对误差后最终确定神经元数目为 8[12]。
(3)GA-BP 神经网络设置训练次数为 100 次,学 习率 0.01,训练目标为 0.001,其他参数见表 1 :
3.2 数据预处理
BP 神经网络需要样本数量具有一定规模,才能进 行训练评估,本文通过实地和网络调研,遵循真实性、 合法性和公开性原则收集成交价在 8-80 万的 300 个二 手车样本作为训练集,以随机价格的 20 个二手车样本 作为测试集,验证模型预测效果。
(1)数字化处理 :将上述二手车价格评估参数 :排 放标准、迁入地区、行驶里程、使用年限、车型、发动 机功率、发动机排量、新车价格进行数字化处理,便于 输入神经网络训练。
(2)归一化处理 :由于上述数据数字化处理后单位 不同,防止数据量纲和数量级不同对神经网络训练造成 影响,将样本进行归一至 [0,1] 之间,公式如下 :
其中 X
max、X
min 分别为样本中的最大值与最小值,X
i 为数字化处理后的原始数据,Y
i 为归一化后的数据。
3.3 GA-BP 模型评价
图 3 为种群适应度随进化代数的变化曲线,种群平均适应度为每一代种群中所有个体适应度的平均值,种群最佳适应度为每一代种群中适应度最大的个体。
将 20 个二手车样本的实际成交价格、BP 神经网络的预测价格、GA-BP 神经网络的预测价格输出,如图 4所示,可见多个样本中 GA-BP 神经网络预测价格与二手车实际成交价格拟合程度更高。
定义 J 为模型对测试集样本价格预测的平均精度,M 为测试集样本数量,计算公式如下 :
分别输出 BP 模型和 GA-BP 模型精度,未经优化的 BP 神经网络预测精度为 75.53%,经遗传算法优化的 BP 神经网络预测精度为 85.72%,且训练次数少于 BP 神经网络如表 2,足以证明使用 GA-BP 模型能更好的实现二手车评估任务。
4 结论
本文基于遗传算法优化的 BP 神经网络建立二手车 价格评估模型,选取排放标准、迁入地区、行驶里程、 使用年限、车型、发动机功率、发动机排量、新车价格 8 个影响二手车价格的评估参数作为模型输入,最终实 现较高精度的二手车价格预测。一定程度上克服了传统 二手车价格评估方法中选取指标单一、人力消耗大和客 观性不足的缺点。使用遗传算法优化 BP 神经网络的权 值和阈值,改进了 BP 神经网络预测精度低,易陷入局部 最优解的不足,经测试对比 :遗传算法优化后的 BP 神经 网络训练次数少、预测精度高、鲁棒性良好,进一步提高 了模型的实用性,为二手车价格评估方法提供了参考。
参考文献
[1] 朱小良.商务部:促进汽车消费将从“四个层面”发力[J].汽 车纵横,2021(5):41.
[2] 钟领,李显君,刘暐.中美二手车市场现状及发展模式比较[J]. 汽车工业研究,2016(9):9-13.
[3] 张远森.基于神经网络的二手车价格评估模型[D].天津:天津 大学,2018.
[4] 吕劲.基于特征优化组合SVM的二手车价格预测研究[D].武 汉:中南财经政法大学,2019.
[5] 王静娜.基于随机森林算法的二手车估价模型研究[D].北京: 北京交通大学,2019.
[6] 李雪磊.基于BP神经网络的二手车价值评估模型的构建及 应用[D].重庆:重庆理工大学,2020.
[7] 李幽,郑兴旺,薛建国.基于神经网络算法的二手商用车估价 模型及应用系统的研究与实现[J].经营与管理,2019(11):63-70. [8] 毛攀,蔡云,万雄,等.基于BP神经网络的二手车价格评估影 响因素研究[J].汽车实用技术,2020(4):59-63+67.
[9] 杨思锐.基于GA-MIV-BP算法的二手车估价模型研究[D].重 庆:重庆理工大学,2020.
[10] 李静,莫思敏.基于改进遗传算法的深度神经网络优化研究 [J].计算机工程与科学,2021,43(8):1503-1511.
[11] 牛玉霞.基于遗传算法和BP神经网络的空气质量预测模型 研究[J].软件,2017,38(12):49-53.
[12] 沈花玉,王兆霞,高成耀,等.BP神经网络隐含层单元数的确 定[J].天津理工大学学报,2008(5):13-15.
关注SCI论文创作发表,寻求SCI论文修改润色、SCI论文代发表等服务支撑,请锁定SCI论文网!
文章出自SCI论文网转载请注明出处:https://www.lunwensci.com/jisuanjilunwen/34561.html