Sci论文 - 至繁归于至简,Sci论文网。 设为首页|加入收藏
当前位置:首页 > 管理论文 > 正文

基于GBRT算法的中小企业成长性评价模型研究论文

发布时间:2023-12-13 10:26:22 文章来源:SCI论文网 我要评论














SCI论文(www.lunwensci.com)

  摘 要:本文首先对我国中小企业的特征进行了分析,搭 建了能够精准评价中小企业成长的指标体系,包含盈利能 力、信用风险、营运效率、管理能力、发展潜力以及技术 创新能力六个维度的指标。然后,利用指标体系建立了中 小企业成长性评价模型,以研究各维度对企业成长的影响 程度。最后,以全国中小企业股份转让系统中的近2千家 企业为例,使用GBRT算法实证模拟验证了模型的有效性 和实用性。

  一、引言

  中小企业在稳定社会、提高就业率以及促进市 场发展等方面具有不容小觑的作用。成长性是指企 业持续发展的能力,通过对企业成长性的评价,管 理者可以及时地发现并解决企业存在的问题,提高 企业管理水平和自我修正能力。此外,评价结果的 好坏将直接影响投资者做出的投资决策。所以,对 企业的成长性进行准确的评价,可以达到多方共赢 的效果。

  现有学者对中小企业成长性的评价主要从企业内 外部因素进行探讨,这为本文研究提供了重要的参考 价值。外部因素指政治、技术和市场竞争等环境影 响。Astrakhan[1]等论证了政府通过利好政策和相关法律 的支持,为企业打造出极佳的外部发展环境;成璐璐[2] 等通过对市场竞争环境变化的分析,得出技术创新对 企业的发展壮大有较大的影响,使企业能够在市场竞 争中处于领先地位。而在内部因素上,学者们更关注 企业的财务和融资等。孔镜翔[3]从中小板和创业板中筛 选了近10年的企业作为样本,借助SPSS软件功能实现 了对企业成长性的评价,通过实证分析,挖掘出企业 中高管的学历对企业成长的影响程度。

  在设计评价体系时,大多数现有研究忽略了企业 成长系统的复杂性,即没有考虑到企业在成长时可能 会受到的各类影响间的相互关系。基于此,本文提出 全新的企业成长性模型框架,在此基础上引用GBRT算 法,通过实证模拟,检验模型的精确性,为企业提供 有价值的参考依据。

  二、基于GBRT算法的中小企业评价模型研究

  (一)评价模型


  GBRT(Gradient Boost Regression Tree) 算法是一 种迭代的回归树算法,会将所有回归树的结论累加起 来作为阶段性结果。最终结果会由迭代多棵树来共同 决策,其核心是每一棵树都是学习之前所有树的结论 和残差。

  其中,回归树的整理流程基本如下示:

  输入:训练数据集D;

  输出:回归树f(x);

  在训练数据集所在的输入空间中,递归地将每个 区域划分为两个子区域并决定每个子区域上的输出值,构建二叉决策树:

  1.选择最优切分变量j与切分点s,求解
\

  遍历变量j,对固定的切分变量j扫切分点s,选择 使式(2)达到小值的对(j,s)。

  2.用选定的对(j,s)划分区域并决定相应的输 出值:
\

  3.继续对两个子区域调用步骤(1),(2),直 至满足停止条件,

  4.将继续输入空间划分为M个区域R1 ,R2 , … , RM ,生成决策树:
\

  当完成回归树流程生成对应的决策树后,使用loss 函数的梯度近似残差,解决残差计算问题;然后,以合残差的近似值利用线性搜索估计叶结点区域的值, 使损失函数极小化,得到最终模型上述步骤即为中小企业成长性评价模型利用GBRT 算法的原理,具有强大的预测能力,不仅可以处理不同 类型的数据,对空间外的异常点处理效果也非常显著。
\

  (二)评价方法

  本文所研究的中小企业评价模型分三步。

  首先,先将GBRT算法作为模型基础,其他两大模 块在此基础上建立。GBRT算法是一种集成学习技术, 它是多个决策树结合形成的预测模型,具有精度高、 泛化能力强、处理非线性数据等特点,非常适合成长 性评价模型的使用。
\

  其次,将处理后的数据交由集成学习模块使用 stacking算法进一步处理,其基本原理是训练集训练出 多个模型,将每个模型的输出作为输入,训练出一个 新的模型作为整体的输出。这一过程能提升模型的精 度、稳定性及泛化能力,让模型的预测能力更为稳定 可靠。

  最后,通过半监督学习模块采用Tri-training算 法,充分利用未标记样本的信息,提升模型预测能 力。如协同训练(Co-train),是基于训练集产生两个 不同的模型(如GBRT和神经网络)同时对测试集进 行预测,将预测结果作为该样本的标签,添加进训练 集,根据扩大后的训练集训练出新的模型,然后重复 此过程。传统建模方法训练模型不使用未标记样本, 但实际上,未标记样本中同样存在大量信息可用于训 练模型,半监督学习可以充分利用这些信息,进一步 保障模型性能。
\

  此外,在模型构建过程中,采用10折交叉验证检 验模型预测性能,即每次抽取十分之九的样本进行建 模,对余下的十分之一的样本进行预测,观察预测效 果,重复十次。该验证标准差较小,预测性能稳定可 靠。即便迭代次数较少,依旧可以实现GBRT算法性能 迅速提升并趋于稳定的效果。因此,该模型以GBRT算 法为基础,在数据规模和质量提升后,通过集成学习 和半监督学习模块,能够进一步提升模型的预测能力 和稳定性,具有研究意义。

  (三)实证模拟

  1.数据来源


  本文选取全国中小企业股份转让系统中的近2千家 中小企业作为分析对象。结合中小企业在系统上所核 算的财务、管理、营运等数据,加之企业或相关政府 部门所公示的该公司的信用风险、知识产权等信息的 量化数据,形成导入模型的基本数据。

  2.评价指标说明

  在已有的研究基础上,充分考虑全国中小企业成 长特点, 在满足GBRT算法要求的前提下,分别从盈利 能力、营运效率等六个维度遴选出中小企业成长过程 的主要影响因素,科学合理地构建中小企业成长性评 价指标体系,如表3所示。
\

  3.实证结果分析

  本次实验在获得原始数据后对数据进行清洗,并 进行重新审查和校验,对重复信息、错误数据进行纠 正,确保从系统中数据的一致性。处理共得1700条数 据,每条数据代表一个企业,特征是评价模型框架对 应的六维和企业对应的总分。

  将处理后的数据导入模型,结合本文所述操作, 通过GBRT等算法的递进使用对1700家中小企业成长 性进行评价。实证分析用Python作为开发语言,通过scikit-learn(机器学习和数据挖掘)、matplotlib(绘制 各种静态、动态、交互式图表和图形)和numpy(科学 计算和数值分析)实现数据处理和建模。

  首先,GBRT算法的估计可以优化侧重于通过生长 多个决策树来最小化损失函数,即优化包括在树的每 个节点找到最小化损失函数的最优分割,并更新、分 配给每个特征的权重。

  其次,将基本数据所具有6个特征进行梯度增强模 型拟合到训练数据的结果是近似目标变量和6个特征之 间的关系的预测模型。也就是构建多个决策树,以目 标变量的分段常数近似的方式拟合先前树的残差,并 组合所有树的预测,以获得最终近似值。

  最后,将10棵树添加到具有6个特征的GBRT模型 之后,目标变量的近似值将变得更加精确。集合中的 每棵树都将在目标变量的分段常数近似中拟合先前树 的残差。最终的近似值将是所有树所做预测的组合, 这将产生更强大、更准确的模型。

  可以看到,图1显示可以防止使用树形结构的过拟 合方法来正则化结果;图2显示当RT为1的时存在高误
\

  差的情况;图3显示通过正则化,交叉验证等技术可以 减少误差,找到最佳数量的树并防止过拟合,确保实 证分析的有效性和准确性。

  综上所述,可以发现盈利能力和营运效率对中小 企业评价模型产生较大的影响,这说明二者在评价企 业成长性时发挥了至关重要的作用。同时,信用风 险、管理能力和技术创新能力也在一定程度上影响评 价结果;而发展潜力对于模型的影响较小,这说明在 中小企业成长过程中可以优先解决盈利、营运和信用 等对成长影响较为明显的方面,再着重提升发展潜力 有助于企业更好地成长。
\

  三、结论

  中小企业成长过程中的影响因素众多,对其成长 性的评价实际上是一个不够准确的考量方式。本文借 助已有的评价经验,研究基于GBRT算法的评价模型, 该模型的优点在于,可以在数据不足、准确度不够的条 件下,扩大信息来源,提高评价分析的可信度。因此, 本文所研究的中小企业成长性评价模型具有一定的实用 价值,旨在为相关人员提供有益的参考和借鉴。

  参考文献

  [1] 邬爱其,贾生华.国外企业成长理论研究框架探析[J].外国 经济与管理,2002(12):2-5.
  [2] 成璐璐,谢恩,李瑜.关系嵌入视角下政治联系与中小企 业研发强度——制度环境与市场竞争的调节作用[J].华 东经济管理,2020.34(4):46-53.
  [3] 张倩.基于突变级数法的中小企业成长性评价模型及应 用[J].财会通讯:中,2011(11):56-57.
 
 
关注SCI论文创作发表,寻求SCI论文修改润色、SCI论文代发表等服务支撑,请锁定SCI论文网!

文章出自SCI论文网转载请注明出处:https://www.lunwensci.com/guanlilunwen/68947.html

发表评论

Sci论文网 - Sci论文发表 - Sci论文修改润色 - Sci论文期刊 - Sci论文代发
Copyright © Sci论文网 版权所有 | SCI论文网手机版 | 鄂ICP备2022005580号-2 | 网站地图xml | 百度地图xml