SCI论文(www.lunwensci.com):
摘要:由于影响学业的因素具有明显的复杂特征,导致对学业问题预测的准确性较低,为此,提出基于模糊关联规则的学生学业预警方法。利用Apriori算法对影响因素进行作用广度优先搜索,并设置了以支持度和置信度为基础的学业影响因素模糊关联规则,最终选定以课堂为主的出勤情况、未听课总时长、玩手机总时长、参与课堂互动频度,以及以课下为主的考试成绩、挂科数量、补考成绩、重修次数、重修成绩作为学生学业预警的主要参考因素,通过关联规则对其进行个性化赋权,并考虑因素动荡对学业发展的影响,引入了校正机制,结合影响因素的综合作用强度完成对学业的预警。测试结果表明,设计方法学业预警的准确率可以达到94.0%,具有较高可靠性。
关键词:模糊关联规则;学业预警;Apriori算法;支持度;置信度;赋权;校正机制
Early Warning Method of Students'Academic Performance Based on Fuzzy Association Rules
SU Jin
(Guangxi Electrical Polytechnic Institute,Nanning Guangxi 530007)
【Abstract】:Due to the obvious complex characteristics ofthe factors affecting academic performance,the accuracy of academic problem prediction is low.Therefore,this paper puts forward an early warning method for students'academic performance based on fuzzy association rules.The Apriori algorithm is used to search the influencing factorsfirst,and the fuzzy association rules of academic influencing factors based on support and confidence are set up.Finally,the attendance mainly in class,the total time of not attending classes,the total time of playing mobile phones,the frequency of participating in classroom interaction,and the test scores mainly after class,the number of failed subjects,the make-up test scores,the number of retakes and retakes are selected as the main reference factors for students'academic early warning.Individualized weight is given to them by association rules,and the influence of factors turbulence on academic development is considered.A correction mechanism is introduced,and the early warning of academic performance is completed by combining the comprehensive strength of influencing factors.The test results show that the accuracy of academic early warning ofthe design method can reach 94.0%,and it has high reliability.
【Key words】:fuzzy association rules;academic early warning;Apriori algorithm;support degree;confidence;empowerment;correction mechanism
0引言
随着教育教学机制的不断改革,以大数据为基础的教学成果分析方法已经逐渐在高校实际工作的开展中得到了广泛地应用[1,2]。在此环境下,整合课程、课堂、课外数据的学业预警研究成为了教学工作个性化推进的重要支撑。在实际的学习过程中,影响学业的因素是多样化、复杂化的,并且这些因素之间也存在一定的关联关系[3]。结合这一特点,通过对相关因素的离群情况进行分析挖掘,即可以得到该因素对于学生学业的影响程度。从数据本身的角度对学业预警进行分析,其可以理解为根据离群数据是指偏离正常数据阈值范围的综合程度,对学生学业发展的预测[4,5]。由于学生本身是一种具有较强特殊性的数据源,因此对其学业进行分析预警时,需要充分结合多元数据[6]。
为此,本文提出基于模糊关联规则的学生学业预警方法研究,并通过试验测试的方式分析验证了设计方法预警结果的准确性。通过本文的研究,以期为院校教学工作的开展提供有价值的参考,及时对存在学业危机的学生给予帮助,助学广大学子都可以顺利完成学业。
1学生学业预警方法设计
1.1学业影响因素模糊关联规则构建
考虑到影响学生学业的因素具有多样化、复合化的特征,且各因素之间也存在一定的相互作用关系。为此,本文在对学业进行预警前,首先构建了各影响因素之间的模糊关联规则。Apriori算法作为一种具有较强学习能力的关联规则构建算法,本文利用其实现对学业影响因素间关系的挖掘。
首先,本文利用Apriori算法对影响因素进行作用广度优先搜索,并用树型结构对搜索目标进行计数。在此基础上,假设搜索数据长度为n,其中包含的候选项目集数量为m。Apriori算法对数据进行迭代处理,此时数据中包含的学业影响因素即全部为频繁项集,为了将其作用较小因素造成的计算冗余,本文设置了最小支持度阈值,当频繁项集的支持度小于该值时,则过滤该因素,其判定方式可以表示为如式(1)所示:
其中,ε表示频繁项集的最小支持度与频繁项集的实际支持度计算结果之间的差值,supportmin表示频繁项集的最小支持度设置值,support表示频繁项集的实际支持度值。其中,本文将支持度的计算规则设置为频繁项集在全部数据样本中所占的比例。假设分析的学业影响因素a1与学业影响因素a2之间存在关联性,那么二者之间的支持度可以表示为如式(2)所示:
其中,Number(a1,a2)表示学业影响因素a1与学业影响因素a2同时在数据集中出现的次数。同时,设置了置信度关联参数,其表示一个因素出现后,另一个因素也出现在该数据中的概率,利用其对学业影响因素a1与学业影响因素a2之间的关联性进行计算时,可以表示为如式(3)所示:
其中,conhdence(a1→a2)表示学业影响因素a1与学业影响因素a2之间置信度。
通过这样的方式,实现对学业影响因素模糊关联规则的构建,为后续的学业预警提供基础。
1.2学生学业预警
在此基础上,本文设置了以课堂为主的出勤情况、未听课总时长、玩手机总时长、参与课堂互动频度,以及以课下为主的考试成绩、挂科数量、补考成绩、重修次数、重修成绩作为学生学业预警的主要参考因素。考虑到不同因素的作用强度不同,本文结合各个因素的支持度,为上述指标构建了个性化的权重参数,其可以表示为如式(4)所示:
其中,W(a1)表示a1因素在计算学业发展时的权重参数。同样地,按照这样的方式计算出上文构建所有参考因素的权重值。
考虑到学生的状态具有一定的波动性,并且其直接与最终的学业完成情况相关,因此本文在分析过程中引入了极值参数,利用其对学业发展预测结果进行校正。具体的实现流程如图1所示。
按照图1所示的方式,首先通过影响因素权重得到对应的模糊矩阵模型,其可以表示为如式(5)所示:
在此基础上,分析因素的稳定性,当其无波动时,直接利用矩阵即可计算得到各因素的作用强度,其可以表示为如式(6)所示:
其中,d表示学业预测结果。
当因素的稳定性存在波动时,考虑到波动的方向与其对学业的影响方向是一致的,因此本文直接将其作为模糊矩阵模型校正的参数,此时的模糊矩阵模型可以表示为如式(7)所示:
其中,k表示影响因素的波动程度,其取值的正负取决于波动的方向。对应学业预测结果可以表示为如式(8)所示:
当d>0.6时,则认为可以顺利完成学业,无需预警;当d<0.6时,则认为无法顺利完成学业,并作出预警。结合实际情况,可以设置分级预警模式,设置对应方阈值参数,以此提高预警的精确程度。从式(6)中可以看出,本文是以百分制为基准对学业情况进行分析的。当实际情况有所差异时,按比例调节对应参数和预警标准即可。
2测试分析
在上述基础上,对本文提出的学业预警方法进行测试分析,不仅如此,为了提高测试结果的可靠性,应用文献[4]和文献[5]提出的预警方法同时进行测试,通过对比三种方法的预警结果与实际结果之间的差异,对其预警的可靠性进行分析。
2.1测试环境
本文以某大学为研究对象,通过其教学管理系统,提取了100条学生的基础数据信息,包括学生的学号、专业、历史成绩、补考次数、补考成绩、重修次数、重修成绩等。在此基础上,为了更加全面地对学业状态进行预测,对相关加分情况以及平时成绩进行综合考量。其中,加分情况主要包括学生参加比赛、发表论文等情况,平时成绩主要是学生的课堂表现情况以及出勤等。具体的测试数据如表1所示。
对于课堂表现数据的采集,主要是通过教师反馈、调查问卷以及课堂监控获取。在此基础上,采用三种方法进行预警分析。
2.2测试结果
在上述基础上,分别统计了三种方法的预警结果与实际学业完成情况之间的关系,为了细化对结果准确性的分析,本文设置了2个预警等级,其中,一级预警为处于顺利完成学业的临界状态,为低风险预警;二级预警为处于无法完成学业的危险状态,为高风险预警。分别统计了三种方法中预警结果与实际学业完成情况,其中,顺利完成学业但预警结果为1级的人数表示为X1,顺利完成学业但预警结果为1级的人数表示为X2,分数在及格线附近5分范围内但未预警的人数表示为X3,分数在及格线附近5分范围内但预警结果为1级的人数表示为X4,分数在及格线5分以下但未预警的人数表示为X5,其结果如表2所示。
从表2中可以看出,对比三种方法,文献[4]方法的预警结果出现异常的次数共计25次,可靠性较低;文献[5]方法与之相比有一定的提升,但是整体稳定性偏低,特别是对处于临界状态的预警,误差较大。相比之下,本文提出方法整体预测结果中,出现误差的人数仅为6人,且未出现存在学业风险但未预警的情况。测试结果表明本文提出的方法可以根据学生的学习状态,实现对其学业发展的准确分析。
3结语
学生本身作为一个相对独立的个体,由于主观原因或客观原因的影响,其在完成学业的过程中难以避免地会遇到不同的问题。本文提出基于模糊关联规则的学生学业预警方法研究,结合学生的日常学习中的表现以及其自身的属性特点,实现了对其学业状态的有效分析,并对可能存在的问题作出了准确预警。通过本文的研究,希望可以帮助学生有针对性地调整自身的学习状态,在教师的有效辅助下,顺利完成学业。
参考文献
[1]王红青,陈波,赵祖平,等.基于二元Logit回归模型的大学生学业问题影响因素研究[J].科技与创新,2022(1):40-43.
[2]原容莲.“百万扩招”背景下高职院校学生成绩管理现状及对策—基于某农类高职学业预警的现状分析[J].河南农业,2021(27):9-11.
[3]张航,叶少林,毕明芳.基于信息化建设的高校学业预警机制的理论与实践研究—以广州城市理工学院为例[J].科教文汇(中旬刊),2021(7):17-19.
[4]王叶,胡海滨,段利强.大数据背景下基于易班的高校学业预警机制研究—以杭州电子科技大学为例[J].科教导刊,2021(19):1-3.
[5]颜金龙,李献丽,侯舟波.基于PSO-SVR算法的高职学生学业预警模型研究[J].江苏科技信息,2021,38(15):57-59.
[6]张玥,邹健,柏天燕.基于在校行为轨迹的大学生学业预警机制研究—以安徽工程大学为例[J].铜陵学院学报,2021,20(2):64-66+74.
关注SCI论文创作发表,寻求SCI论文修改润色、SCI论文代发表等服务支撑,请锁定SCI论文网!
文章出自SCI论文网转载请注明出处:https://www.lunwensci.com/jisuanjilunwen/46103.html