SCI论文(www.lunwensci.com):
摘要:在线教育作为现代教育的一股新生力量,正在被成千上万学生广泛使用。在其便捷、个性化网络教学服务的优势下,传统教育逐渐显露出其弊端。在线教育无论在功能、师资力量、课程设计多元化等方面都对高校学生的学习方式产生了影响。而用户对在线教育的使用评价能直接反映出在线教育平台的优劣势。本文通过收集用户对在线教育的主客观评价,采用文本挖掘方式综合地分析高校学生对网络教育满意度。首先,将采集到的数据进行清洗、中文分词,采用情感分析和LDA主题分析等算法和模型进行分析。然后,通过分析的数据,我们初步而全面地评估平台在资源量、页面设计及系统维护等方面的优劣势,进而对在线教育提出改进性建议,并为大学生选择个性化、专业化的学习方式提供参考意见。
关键词:在线教育;用户评价;文本挖掘;教育改革
本文引用格式:张东敏,等.当前我国高等教育在线教育平台满意度评价[J].教育现代化,2019,6(53):175-180.
自2012年MOOC和创新课堂被引入中国后,各种各样的在线教育平台开始涌现在网络教育的世界中[1]。业界学者也倾向于探讨网络课堂和传统课堂的优劣势比较,但是针对于其他网络课程如中华会计网校、沪江网校等的实际研究却很少,并且已有的研究也仅限于理论分析或者宏观调查,缺乏一手数据的分析。通过选取用户使用量较大的不同方向的几个在线教育平台—中国大学MOOC、学堂在线、新东方在线、中公教育等主要在线教育平台,抓取用户评论数据来分析当前我国高等教育在线平台的运营情况和优劣势,可以以更好地对在线教育平台提供改进性建议。
一对主要在线教育平台的文本挖掘
高校学生或其他用户在使用在线教育平台的过程中会对该平台的教育资源、授课质量、软件系统的操作性等服务留下自己的主观感受或客观评论,而有效地倾听用户的心声是在线教育平台全面提升自身竞争力的重要途径[2]。众多在线教育平台APP在使用界面都设有用户评论操作,我们利用众多教育平台的海量用户评论通过文本挖掘技术对用户评论信息进行筛选过滤、信息特征提取[3],分析和探讨用户在使用在线教育平台后的切实感受,以此来帮助在线教育平台更好地了解用户的需求和平台自身的优劣势。
(一)评论数据采集
应用商店里在线教育平台手机APP的下载界面处给出了用户的使用评价。其中中国大学 MOOC 和新东方在线的用户评论界面如图:
如上图所示,用户评论操作中含有综合评星、各星级比例、评论内容、用户名、评论时间和使用版本等信息。通过 Python 首先编写数据采集逻辑, 然后运行程序,共采集到中国大学 MOOC、学堂在线、新东方在线、中公教育、有道学堂等主要在线教育平台的 3761 条数据。得到的数据结构示意图如表 1-3 所示。
(二) 评论数据预处理
由于用户评论属于文本类数据,所以难免会出现一些无意义字符,同样评论来源、评论类型、评论的序号和编号也都会影响数据的分析,所以这些也需要过滤掉。1.考虑到评论数据中难免会出现诸如“666666”、 “。。。。。”等无意义的字符,我们首先将数据中这些无意义的字符过滤掉。
(三) 评论数据的中文分词处理
中文在书写的时候没有区分词语的标志,它将一个意思表达完之后在用标点符号作以结束。但往往一个词语却蕴含了说话人的态度、想法和见解。例如:“不错”表示一种积极的评价;“讲课”表示进行的动作。为能将评论者对网络教育平台的评价简短搜集出来,我们选择了Python语言的jieba包进行中文分词工作。文本分词的工作也就是将连续的字序列按照一定的规范重新组合成词序列。分词的基本原理及步骤如下:
1.基于Trie树结构实现高效的词图扫描,加载词典。jieba分词自带了一个dict.txt的词典,在词图扫描中,利用Trie树中的词条扫描文本中存在的公共前缀,减少无谓的字符串比较。
2.从内存的词典中构建该句子的DAG(有向无环图)。使用DP寻找DAG的最大概率路径。如果是登陆词,则输出分词结果。
3.如果是单字,将其连在一起的单字找出来,这些可能是未登录词,对于词典中未收录词,使用HMM模型的viterbi算法尝试分词处理[5]。
4.已收录词和未收录词全部分词完毕后,使用HMM模型进行分词。
5.输出分词结果。
按照以上步骤,去掉停用词之后,得出有效评论2422条,根据高频词画出200词的词云,见图3。词出现的次数越多,该词的字号就越大。根据上图可以发现使用APP听网课的用户的评价中出现了积极的词汇如“喜欢”、“幽默”、“清晰”,也有消极的词汇,如“闪退”、“错”、“少”等。但是出现次数最多的还是中性的与使用目的相关的词汇,如“课程”、“网校”、“考试”、“学习”。
(四)基于情感词典的情感倾向性分析
情感分析是指挖掘文本表达的观点,识别主体对某客体的评价是褒还是贬,根据褒贬态度进行倾向性研究 [6]。我们首先按照中国知网发布的“情感分析用词语集”采用人工标注的方法确定基准词,并对其进行语义相似度计算,将所得新情感词加入情感词典中,以提高准确率。根据中文分词的结果,依次与预先构建好的情感词逐个查找 [7],最后统计出不同类型情感词所对应出现的频次。
由情感数据分析图可以看出,对于大部分网络教育平台,绝大部分消费者都是持积极态度的。说明在线网络教育平台在一定程度上赢得了大多数用户的青睐。
(五)基于LDA的主题模型分析
传统判断两个文档相似的方法是通过查看两个文档共同出现的单词的多少,如TF-IDF等,但都没有考虑到文字背后的语义关联[9],比如两个文档共同出现的单词很少甚至没有,但两个文档确是相似的。而LDA模型就是通过计算单词与主题的相关性来进行语义挖掘的模型。它包含词、主题和文档三层结构,通过词袋(bag of words)的方法,将每一篇文档视为一个词频向量,从而将文本信息转化为了易于建模的数字信息[10]。其建模过程如下:
通过以上流程,得到的主题分析结果如下:
从主题分析结果可以看出,在好评中,主题1中“感谢”、“太棒”、“不错”等特征词显示了用户对在线教育平台的主观心理感受;主题3中的“易懂”、“流畅”、“方便”表明一部分在线教育平台的系统功能得到了使用者的认可。主题3为中性词,“个人修养”、“基础”、“讨论”说明用户在网络教育平台学习知识也关注自身的修养和学习形式的多元化。差评中,“崩溃”、“失败”“冤枉钱”等高频特征词说明部分用户由于课程的内容和价格没有在在线教育平台得到良好的体验,“闪退”、“流量”、“打不开”说明部分平台在系统方面差强人意,应加大平台系统优化力度。主题3中出现“加载”、“客服”、“发音”等词,说明网络教育平台也应该注重在售后服务和课程流畅等方面提升自己。
二 在线教育平台的革新方向
(一)加强平台的系统维护
从以上结果可以看出,无论在词云图还是主题分析结果中,在线教育平台的使用者对APP的系统功能方面都评价较低,这会直接导致使用者的厌烦或抵触情绪,进而影响平台的用户量。因此平台运营商在保证课程质量的同时还需在视频流畅度、软件运行方面提升产品质量,提高课程的使用方便程度。
(二)提供付费课程的同时适当考虑学生的消费水平
由于在线教育平台使用者大多为高校学生,支付水平有限,可能因价格过高而错失一些质量优等课程,所以平台在付费课程的定价上应考虑学生的支付能力,加大力度提供免费课程服务,对于部分必须收费的课程,可以免费试听,以便学生选择适合自己的课程[11]。网络教育平台商家还可以提高平台的页面设计,提供功能更强大的平台,吸引大学生用户,使在线教育实现真正意义上的普及。
(三)促进线上课程互动,建立有效监督体制
网络课堂淡化了团结合作意识,降低了社交能力,并且老师不能对学生的学习情况进行有效监督,这使得使用在线教育平台的学生容易在评论中发牢骚。所以,课程设计应朝着师生互动和监督的形式[12],使学生在在线学习中仍然能感觉到现实课堂中的乐趣。
(四)针对用户提供个性化学习服务
现如今在线教育平台的数量较多,竞争力较大,若想在中赢得较多的客户,平台必须时刻根据客户需求和同行业的变化来不断优化自己的课程服务。高等在线教育平台的使用者大多为高校学生和职场新人,需求多集中于考研、出国留学和考取各类资格和能力证书,所以需求不尽相同。网络教育平台应根据不同用户的需求设计不同种类的网络课程,并提高售后服务,达到课程服务一体化。
参考文献
[1]孙婧超,赵海霞,李佩倩,等.关于大学生使用网课教学的影响因素研究[J].赤子,2015,22:54-55.
[2]申明.在线教育--颠覆传统学习模式[N].科技日报,2013.
[3]谢志群,张国煊.文本挖掘与中文文本挖掘模型研究[J].情报科学,2007,25(7):1046-1050.
[4]顾益军,燓孝忠,王建华,等.停用词表的自动选取[J].北京理工大学学报,2005,25(4):337-340.
[5]谢高建,胡学钢,王庆.文本挖掘中的中文分词算法研究及实现[J].计算技术与发展,2007,17(12).
[6]闻彬,何婷婷,罗乐,等.基于语义理解的文本情感分类方法研究[J].计算机科学,2010,06:261-264.
[7]周立柱,贺宇凯.情感分析研究综述[J].计算机应用研究.2008,28(11):2726-2727.
[8]乐国安.情感分析技术及应用[D].2015.
[9]胡佳妮,郭军.基于短文本的独立语义特征抽取算法[J].通信学报,2007,28(12):121-122.
[10]石晶,范猛,李万龙.基于LDA模型的主题分析[J].自动化学报,2009,12:1586-1592.
[11]苌景州.教育投资经济分析[M].北京:中国人民大学出版社,1996.
[12]华亭.Coursera:在线教育的新革命[J].教师博览,2013(03):17-18.
关注SCI论文创作发表,寻求SCI论文修改润色、SCI论文代发表等服务支撑,请锁定SCI论文网! 文章出自SCI论文网转载请注明出处:https://www.lunwensci.com/jiaoyulunwen/11270.html