Sci论文 - 至繁归于至简,Sci论文网。 设为首页|加入收藏
当前位置:首页 > 教育论文 > 正文

基于CART的师范类本科毕业论文质量预测研究论文

发布时间:2024-04-11 11:11:23 文章来源:SCI论文网 我要评论














SCI论文(www.lunwensci.com)
 
   摘要:为了提高学生培养质量,文章首先论述了相关概念,然后采用数据挖掘技术中的 CART 决策树算法对 师范类本科毕业论文质量预测进行了探究,最后根据问题提出了几点建议。

  关键词:本科毕业论文,质量预测,CART,师范类

  近年来,随着高等教育的不断扩招,出现了师范 类本科生培养质量下滑的现象[1] 。部分学生对于在校 期间的知识学习仅停留在理论学习,不懂得联系实际 运用,导致出了校门后无法适应职场生活,不符合岗 位提出的要求,同时教师讲课水平较低,不能很好地 处理教学过程中出现的紧急情况, 教学效果并不好。 这些问题都反映出了近年来师范类专业本科毕业生 培养质量下降、高校办学者忽视培养质量的问题,因 此提升师范类本科生的培养质量势在必行。

  毕业论文作为学生结束本科生活的最后一道门 槛,在撰写的过程中,需要学生综合运用自己在大学 本科阶段所学的专业知识,有针对性地发表自己对某 一教育学问题的见解,检验自身实践应用和创新的能 力 。因此,毕业论文的成绩可以在一定程度上反映学 生在校期间对于知识的理解和应用水平,能够体现学 生的培养质量。

  探索影响师范类专业本科毕业论文质量的因素, 利用教育数据挖掘技术进行预测,可以起到一定的预 警作用,进而提升师范类专业本科毕业论文质量 。因 此,本文采用 CART 决策树算法对师范类本科毕业论 文质量进行预测,进一步探究影响本科毕业论文质量 的因素,并提出相关建议。

  一、相关概念

  (一)决策树


  决策树算法是一种应用于预测的算法,通过对数 据进行分类或回归,找出最有价值的信息 。这种数据 分类是有目的的,是基于信息熵、信息增益及信息增 益率,通过比较信息的信息增益来选择最明显特征进 行分类预测 。在进行数据分析时,选择信息增益更大 的信息特征作为节点进行树的建立,并在经过大量数 据训练后 , 建立预测模型 。决策树算法主要有 ID3、 C4.5 及 CART 算法 。其中,前两种是在计算信息的基础上进行决策树的建立,而 CART 算法则是通过计算 基尼系数来建立决策树的。

  (二)CART 算法

  CART 算法是分类回归决策树 , 意味着该算法 既可以进行分类,也可以处理回归问题。不同于 ID3 算法和 C4.5 算法,CART 算法将信息增益的计算改 变为对基尼系数的计算 。基尼系数与信息熵的二分 之一近似,并与模型的不纯度成正比,可用来表示 模型不纯的程度,而不纯度又与特征的优劣程度成 反比例关系[2]。

  由于基尼系数与一半的信息熵在曲线上是很相 似的,因此基尼系数可以代替信息增益(率)进行决策 树构建。

  (三)算法步骤

  1.算法步骤 。算法步骤如下所示。

  输入:训练样本。

  输出:CART 决策树。

  从根结点输入训练样本集,在每个结点进行以下 步骤的运算,构造决策树。

  Step 1:训练样本集为 D,特征为 A 特征的每个可 能取值为 a ,利用上一小节中的公式计算当特征 A 取 值为 a 时的基尼系数。

  Step 2:通过计算得到所有特征的基尼系数取值 及特征取值切分点(a),选择基尼系数最小的特征作 为最优特征,其对应的切分点作为最优切分点 。按照 这个切分点来构建二叉树。

  Step 3:重复 Step 1、Step 2.直到算法停止,条件符 合,退出为止。

  2.算法停止条件 。算法停止条件如下所示。

  首先,叶子节点中的样本数小于预先设定的值。

  其次,基尼系数小于预先设定的值。

  最后,所有特征轮询完毕。

  二、基于 CART 的师范类本科毕业论文质量预测 模型构建

  (一)数据准备

  数据准备环节就是对影响高校学生毕业论文质 量的因素进行特征选择 , 这一环节是极其重要的,会 在很大程度上影响预测的结果。本文将所在院校师范 类专业本科培养方案作为研究依据,围绕学生专业必 修课的成绩,研究影响论文成绩的因素,并形成根据 成绩进行毕业论文成绩预测的模型, 具体步骤如下: 首先根据特征数据的完备情况,去除一些数据不全的 特征,而在选择特征时,可以先把所有的特征都纳入 训练,通过决策树模型训练,在得到的决策树中丢弃 一些信息增益小的特征 。在本实验中,最后确定选择 学生从大一到大三三年的各科成绩作为最终的输入, 这是因为根据学生培养方案所示,从大四开始,学生 都在为实习做准备,因此选择成绩的时间截至大三。

  (二)数据预处理

  处理样本资料,去除部分空值资料,对一些特征 进行归一化处理等 。在本模型中, 最终选取样本 74 个,包含 3 577 条数据。

  (三)构建决策树

  1.分析实现过程 。本研究采用 Python 编程语言, 实现 CART 决策树算法,使用 Pandars、Sklearn 等库分 别进行数据清洗、数据集分割、计算和决策树可视化 输出 。CART 决策树的具体实现过程如图 1 所示。


\

 
  决策树模型构建过程说明如下。

  Step 1:数据处理和分析的工具包的导入。本预测 原型系统利用了 Pandas、Sklearn 库对数据进行处理和 分析。

  Step 2:使用 Pandas 对数据集进行读取,通过读 取数据的前 5 行了解数据。

  Step 3:区分特征列和目标列,建立特征矩阵和标 准矩阵,利用 get_dummies 将离散特征转化为 one-hot 编码形式。

  Step 4:构建模型,首先初始化一个决策树分类器,其次用决策树分类器拟合数据,最后打印决策树 分类器的结构。

  Step 5:输入预测数据后进行预测。

  Step 6:决策树可视化。

  Step 7:输出预测结果、运行时间,比较优化前后 的过拟合度。

  2.测试模型 。模型测试步骤如下。

  首先,从某高校数据库中随机抽取 74 名师范类 专业本科生的课程成绩(共 3 577 条记录)作为测试 样本集,并将数据进行归一化整理,分为 57 个维度, 如表 1 所示。
\
\
\

 
  其次,以基尼系数为基础,通过训练样本集构造 决策树。

  最后,根据基于基尼系数的决策树对该样本的本 科毕业论文成绩进行预测,将预测结果与该生本科毕 业论文成果的实际情况进行比较,计算出原型系统预 测本科毕业论文结果的准确度和运行时间。

  (四)分析实现结果

  用样本数据对 CART 决策树模型进行训练,去掉 信息增益小的特征 , 并通过提升法进行算法改进,最 终得到 CART 决策树,如图 2 所示。


\

 
  (五)算法准确率的比较

  在 K-MEANS 算法、BP 神经网络算法中分别带入 样本数据 , 比较 3 种算法所构建模型的预测性能,评 价标准位准确性、运算速度。

  1.k-means 算法 。K-means 算法是一个利用反复 迭代来进行求解的聚类分析算法,目的是使聚类域中 所有的样品到聚类中心距离的平方和最小,算法流程 包括 4 个步骤,具体如图 3 所示[3]。


\
 
  2.BP 神经网络算法。鲁姆尔哈特和麦克里兰等于 1986 年提出了 BP(Back Propagation)网络,这是一种 按误差逆传播算法训练的多层前馈网络 。在 BP 神经 网络的基础上,BP 神经网络算法产生存在正向和反 向传播两种过程,其拓扑结构包括输入层、隐藏层、输 出层三个层次[4]。

  3.实验结果比较 。通过三种算法对师范类本科生 毕业论文进行预测,可以比较出师范类本科生毕业论 文质量预测的准确性,如表 2 所示。

\
 
  通过对比可以发现,在准确率方面,CART 决策树 算法的预测准确性更高,而且能够通过树形图表示各 科课程成绩对师范类本科毕业论文质量的影响程度; 在运行时间方面,k-means 算法最快,但是速度快的同 时牺牲了准确率,而 CART 决策树算法在运行时间方 面排在第二位,但是保证了预测的准确率 。由此可知, CART 决策树算法的性能最优。

  三、研究结论与展望

  (一)研究结论


  将得到的决策树模型用于本科毕业论文质量的 预测,得到的预测准确率为 84.93%,满足决策参考,并 通过与 k-means 算法和 BP 神经网络算法进行准确率 与运行时间的对比,可以发现 CART 决策树算法具有 较好的优越性。

  从输出的决策树图可以看出,影响本科师范类专 业毕业论文质量的主要课程包括课外科技活动、班主 任工作、毛泽东思想和中国特色社会主义理论体系概 论(实践)、大学计算机基础及 C 程序设计、教育见习、 教学设计、教育学基础、大学英语。

  第一,从输出的课程可以看出,课外科技活动对 于本科毕业论文成绩影响最大 。师范类专业的学生 在进行毕业论文书写特别是论文选题时 , 需要将所 学专业知识与自己感兴趣的研究问题相结合 , 或者 根据自己在实习期间遇到和发现的一些教育问题现 象进行论文选题 。可见,因本科培养的特点,课外的 实践类课程对于师范类专业学生本科毕业论文质量 的影响较大。

  第二,班主任工作和毛泽东思想和中国特色社会 主义理论体系概论(实践)也会影响本科师范类专业 毕业论文质量,且可以看出排名前三的重要影响因素 主要体现在实践性能力的培养方面。师范类专业的本 科生是作为未来教师进行培养的,实践能力是非常重 要的,因此在进行毕业论文撰写时,其应该根据实际 的教育问题进行研究,或者针对问题提出建设性的意 见等 。因此,学生在这类实践课程中的成绩会对其本 科毕业论文质量产生重要影响。

  第三, 大学计算机基础及 C 程序设计 、教育见 习、教学设计、教育学基础、规范汉字书写、大学英语等课程是与师范类专业相关的课程 , 这些课程涵盖 了本科毕业论文撰写的基础知识 。同时,在教育信息 化高度发展的今天 , 信息技术在教育中的应用越来 越普遍,这也要求教师紧跟时代发展,积极利用高新 技术提高教学技能 。因此,这类与教师技能与专业能 力相关的课程是学生必备的, 其课程内容也是师范 类本科生进行论文书写时的知识基础 , 对师范类本 科生的本科毕业论文质量产生了重要影响。

  (二)研究展望

  虽然本文进行了基于 CART 决策树的师范类本 科毕业论文质量预测研究,但研究工作还有需要改进 的地方。此次研究的毕业论文质量预测是在比较理想 的情况下进行的,即样本数据没有噪声数据和缺失数 据的影响,没有极端属性对决策树构建的影响,但同 时忽略了算法进行多次预测后的学习性 。因此,未来 相关人员可以在关键技术整合、深入教育应用研究及 关键技术创新等方面进行完善 , 使调查研究更科学、 合理、真实[5]。

  四、问题及建议

  (一)问题


  随着高校招生规模的扩大,我国进入了高等教育 大众化时代,虽然扩招有许多好处,但也导致生源质 量下降,进而使本科毕业生,特别是师范类本科生的 培养质量出现问题 。基于以上背景,通过对相关文献进行总结发现,当前师范类本科毕业论文质量主要存 在以下问题。

  1.写作态度不端正。有调查显示,2014—2018 年, 中国撤稿的论文数、因科研不端行为撤稿的论文数均 高于美国、英国、德国、日本四国的总和,并且在科研 不端的类型中, 剽窃类占据各国科研不端行为的首 位 。 由于网络的发达,有些学生在网上找“枪手”代写 论文,甚至有些学生会被一些居心叵测的“代写”勒索 钱财等[6] 。这种写作态度不端正的问题在各类专业的 本科生中层出不穷,师范类专业本科生也不例外 。师 范类本科生的培养更偏重实践,故而这种模式会使学 生产生一种学术研究不重要的想法,出现不注重专业 知识的学习、不重视本科毕业论文的撰写等问题。

  2.论文缺乏新意 。毕业论文的创新性不足主要体 现在选题、内容、方法三方面。选题是本科生开展毕业 论文工作的第一步,但绝不是从“ 零”开始,题目的选 择与学生的知识积累与学术素养密切相关,如果缺乏 必要的知识与素养,学生就很难找到自己感兴趣且能 力允许的研究领域,也很难注意到所学专业前沿的研 究问题 。论文结构不成体系、语言表述词不达意等是 论文内容创新力不足的典型表现 。在研究方法上,首 先,论文应标明研究的主要方法,如大部分学生在论 文中都会借助文献法, 但文献法对于任何论文都适 用,不能体现所写论文的独特性;其次,在选择问卷调 查法、访谈法后,学生对于如何使用这些方法、收集到 的数据如何分析利用等,缺乏清晰的思路 。师范类专 业的论文研究更多的是紧跟时事 , 且贴近教育政策、 教育发展的新问题等,会导致学生扎堆研究同一个问 题,难以形成自己的创新点,不利于培养学生的主动 意识、创新精神。

  3.写作规范性较差 。论文写作规范性较差一般体 现在格式不规范、语言不规范、引证不规范等方面。部 分学校对于论文格式的要求不够明确,甚至出现要求 时常变化的现象,导致学生对于论文格式和标准等产 生疑惑,甚至产生自暴自弃的心理,进而导致论文质 量下降 。同时,由于教师指导学生较多,且还有其他课 业任务,分身乏术,不能及时给予学生反馈,提醒学生 进行修改,就会影响论文写作的规范性。另外,学生对 于本科毕业论文的态度 , 也会影响其写作规范性,同 时,实习、找工作及升学等都会占用论文写作时间[7], 特别是师范类本科生在外校实习花费时间更多,由此 学生会产生糊弄心理。

  (二)建议

  1.学生方面。第一,具备扎实的知识储备。“宽口 径、厚基础”是高质量学位论文对学生知识结构的要 求[8],对师范类专业的学生来说,教育学基础、教学设 计、教育研究方法等相关学科知识的交叉运用,可以 创新教育问题阐释视角 。师范类专业学生应加强对 教育学和心理学等相关专业知识的学习 , 根据自己 感兴趣的研究方向,丰富自己的知识储备,为论文撰 写打下坚实的基础 。第二,具备良好的研究态度 。学 生在书写本科论文时会出现排斥论文写作 、写作态 度不认真 、论文选题寄希望于指导教师而不进行自 己思考、大量粘贴复制等问题 。针对以上问题,学生 应树立良好的研究态度 , 通过参加学校开设的课程 或讲座[9],了解毕业论文撰写的要求及规范,明确撰 写本科毕业论文是为了检验自己大学四年的学习成 果,认识到本科毕业论文的重要性;学生还可以主动 同导师进行积极的沟通交流,了解自己的不足,听取 导师的建议,寻找自己感兴趣的研究方向,从而增强 论文撰写的内在动力; 学生还可以寻找与自己有相 同研究兴趣的志同道合的小伙伴 , 一起组建科研团 队,共同研究彼此都感兴趣的问题,通过合作提高本 科毕业论文撰写的效率和质量。

  2.教师方面。第一,发挥指导教师的主导作用。学 生是论文书写工作的主体,指导教师作为指导者,应 主动采取谈心、布置论文写作任务、帮助学生制定计 划等方式,帮助学生;应听取学生的想法,开放选题 并给予指导建议,培养学生的自主意识 。另外,可以 通过邀请学生参加导师的课题、项目等,给学生提供 一条选择题目的途径 , 引导学生的论文写作走上正 途,并随时注意学生动向,及时进行干预 。第二,积极 提升自身的业务素质和科研能力 。导师的指导水平 在很大程度上会影响学生的论文质量,因此,导师要 依据师范类专业的特点 , 界定师范类本科毕业论文 的研究内容、方法等,明确论文写作规范,进行更加 专业的指导 。同时,导师应采用各种途径提高自身的 能力,并关注教育发展趋势,及时给予学生专业知识 方面的指导,满足学生的个性化需求,从而提高其论 文撰写质量。

  3.学校方面。第一,优化学术研究环境。对于学校 来说,要创造条件,通过搭建创新能力培养平台,开展 普及性的实践创新活动,引进教育学专业的著名专家 学者来校进行演讲等[10],使学生了解教育学发展的现状与未来趋势,激发学生参与创新的热情;开设文献 检索、教育研究工具、教育研究方法、教育期刊研读等 课程,丰富学生的相关知识储备;应加强实验室、图书 馆及网络学术资源等教学基础建设,改善学生的研究 条件,满足学生的科研需求。第二,加强毕业论文过程 监督与管理。学校要制定严格有效的毕业论文过程管 理制度和导师责任制度, 要求导师随时注意学生动 向,并及时进行适当干预,如在预知学生论文成绩的 基础上,积极地采取措施,及时止损或弥补,保证学 生毕业论文质量;可根据上一年的论文写作情况,改 进课程设置、课时分配、班额等,以促进下 一 届学生 毕业论文质量的提高 。同时,严格把握论文答辩评判 标准 , 按照学校指定的论文评判流程进行本科毕业 论文评价 , 杜绝学生认为本科毕业论文一定会通过 的错误想法,避免毕业论文答辩过程流于形式,使其 对学生起到警示作用。

  五、结语

  本科毕业论文质量是检验师范类专业本科生在 校期间专业知识与能力水平的重要一环 , 而本科生 在校期间的各门课程成绩作为影响本科毕业论文质 量的重要因素,可以预测师范类本科毕业论文质量, 教师要根据预测结果及时对学生加以干预 , 保证论 文撰写质量 。本文基于 CART 决策树算法进行预测, 根据输出的决策树图进一步探究哪些科目对师范类 专业本科毕业论文的影响更深远, 之后结合师范类 本科毕业论文存在的问题,从学生、教师、学校三个方面提出促进论文质量提升的建议 , 以期把毕业论 文质量提升的措施落实于学生学习的各个过程,从 而让学生更好地走向以后的工作岗位 。高等院校应 提高对本科毕业论文工作的重视程度 , 把培养师范 类专业学生的教育实践能力和科研能力作为人才培 养的重点 , 采取相应措施切实提高师范类专业学生 的质量[11]。

  参考文献:

  [1] 廉阳.博士学位论文质量的影响因素及预测研究[D].武汉:华中 师范大学,2018.

  [2] 周超,郝冬冬,张洪文.“交叉学科”选题下的本科毕业论文的质量 提升与探讨:以生物医用高分子材料为例[J].高分子通报,2022(3): 79-82.

  [3] 王森,刘琛,邢帅杰.K-means 聚类算法研究综述[J].华东交通大学 学报,2022.39(5):119-126.

  [4] 田利军,王景博.本科毕业论文质量关键影响因素检验:基于天津 高校 140 篇会计学专业论文的数据[J].财会月刊,2016(21):116-120.

  [5] 王继东.三维打印虚拟仿真教学系统关键技术研究[D].南京:南 京师范大学,2018.

  [6] 郭长立,杨曼,潘昊.本科生毕业论文抄袭问题的治理及效果比 较[J].实验技术与管理,2013.30(3):130-134.

  [7] 侯晓华.本科生毕业论文质量的影响因素及其监控[J].教育学术 月刊,2011(7):62-63.66.

  [8] 林婷婷.基于 BP 神经网络算法的成绩预测模型研究[J].计算技 术与自动化,2022.41(1):79-81.147.

  [9] 许信刚,童德文.大学本科生毕业论文存在的问题及对策[J].高等 农业教育,2011(10):81-83.

  [10] 陈家新.高校本科生毕业论文中存在的问题及对策[J].教育科 学,2002.18(2):43-44.

  [11] 刘慧 . 高等教育新常态背景下提高本科毕业论文质量的探 讨[J].高等农业教育,2016(6):44-47.
 
关注SCI论文创作发表,寻求SCI论文修改润色、SCI论文代发表等服务支撑,请锁定SCI论文网!

文章出自SCI论文网转载请注明出处:https://www.lunwensci.com/jiaoyulunwen/77360.html

发表评论

Sci论文网 - Sci论文发表 - Sci论文修改润色 - Sci论文期刊 - Sci论文代发
Copyright © Sci论文网 版权所有 | SCI论文网手机版 | 鄂ICP备2022005580号-2 | 网站地图xml | 百度地图xml