SCI论文(www.lunwensci.com):
摘要:批改网,国内最大的在线英语作文批改平台,提升了英语写作反馈速度,体现了智能赋予学习平等的共享。文章聚焦了新版批改网特色,以大数据挖掘和学习分析的技术为重点,探讨了批改网提供的可视化图形、图表、报告的应用价值,尤其是错误分布的课堂应用价值以及对精准教与学的辅导作用;指出数据分析能力考验一线教师多元能力,不仅培养学生的自主学习、自适应的能力,而且不断更新自身的知识结构,做到知识与技术融合的新型教师,最后略谈了智能技术本身面临的机遇与挑战。
关键词:批改网;大数据;学习分析;错误分布;精准
本文引用格式:笪玉霞,等.基于数据挖掘的大学英语写作精准辅导的研究[J].教育现代化,2019,6(18):239-244.
Research on Accurate Instruction of College English Writing Based on Data Mining
DA Yu-xia,CHAI Lei,LIANG Hua
(School of Foreign Languages,University of Jinan,Jinan,China)
Abstract:The pigai.org,the largest platform for English writing,has improved speed of feedback in a few seconds,and given a free access to everyone logged in.However,the discussion about the micro application of data mining is not popular.Based on the new features of the improving pigaiwang,the paper explores the visual charts,graphs curves and result reports on the center of two applied aspects:big data mining and learning analytics.Focusing on the accurate assistance of students’errors report,it also points out two applications are a good test for teachers’diverse abilities.As for students,they can cultivate their self-regulated learning as well as self-adaptive learning.Finally,the smart technology is facing upgrading challenges and opportunities.
Key words:Pigai.org;Data mining;Learning analytics;Errors report;Accuracy
互联网+时代是技术快速更新的时代,是思想理念不停更新的时代。智慧学习与智慧教学已经深入教师与学生的行为之中。然而,人工智能提供的海量数据对于教师与学生来说又是一种挑战。“数据智慧”为课堂如何进行精准教学提供了技术支持,“教学智慧”将考验教师的决策与多元行动能力[1]。“数据智慧”同时也考验学生的自主学习能力,构建个性化的自适应学习习惯,进行基于证据的智慧学习。基于大数据分析的定制教学与学习(customization in teaching and learning)将是未来学习的新模式,新动力[2]。本研究具体分析了新版句酷批改网数据的课堂和课下的应用价值:通过新版批改网平台提供的柱状图、曲线图、word版的错误报告进行了新版批改网数据挖掘及其学习分析技术应用这两个方向的微观研究,指出只有人机的融合才能实施有效的精准指导。
一 批改网(最新版)数据可视化及量化情况概述
基于语料库和云计算技术支持的批改网,是一个提供英语作文与翻译自动在线智能批改服务平台。目前是中国最大的英语在线平台,超过5000所学校的师生在使用。自动在线批改服务极大地缩短了大学英语教师批改作文时间,不再为纠正学生的拼写,语法错误而头疼,为教师课堂精讲与课下精准辅导提供了有力的技术支撑。学生也不用苦苦等待老师延迟的反馈。批改网及时给出作文的分数、评语以及按句点评,让每一个利用这个平台的学生都享受了技术创新带来的红利,沐浴了教育技术智能阳光,享受了人人平等的权利。
句酷批改网是由北京词网科技有限公司开发,可以多维呈现学生作文行为的数据。新版批改网数据不仅包括科学计算可视化,而且包括信息可视化,知识可视化的内容,将抽象的数据以图形(饼图、柱状图、曲线)等直观的方式在屏幕上显示出来,实现了不同层级评价的数据可视化(Data Visualization)的目标[3]。这种数据挖掘能有效地帮助教师进行技术分析,动态了解和掌握学生的实际学情,结合学生特点、教材内容等制定线下、线上、课堂三者融合的教学计划,进行基于数据的学习分析,实施精准教学。下面图和表为2018年3月新学期第一次作文的数据,第1070070号作文Does Plastic Surgery Make Women Truly Beautiful?学生为2016级非英语专业(机工1607-1609和特教1601-1602)。
新版批改网数据(教师界面)第一层包括十一个维度:数据概述、学生表现、错误分布、浏览作文、相似统计、词频、搭配、分级词汇、数据比对、维度分析、检索。点击每一个维度,下拉项目包含不同子项。在批改网的作文预览画面,点击“更多”选项,选择“共性分析”,出现上面的11个维度。下面,按照课堂评讲、课下辅导、学术研究这三个视点进行新版批改网数据挖掘分析。
(一)课堂评讲
“数据概述、学生表现、错误分布、浏览作文、相似统计”这五个维度属于宏观数据:包括旧版的信息,如提交情况、得分、字数、相似度、修改次数。下面,分别对这5个维度进行课堂应用价值的分析。
“数据概述”提供三幅图,信息有两部分,一是图,二是文字:如图1“提交统计”柱状图:包括准时提交(159)、补交(0)、人工阅(0)、相似(5人大于40%)以及文字描述“您共收159篇作文,共28,660词,1,669句,最长句75个单词,最短句3个单词。
分数分布曲线图:将分数60设为起点,25人为一组,分为5个段。图2信息如下:1人小于60分,60-69有8人,70- 79有50人,80-90有98人,90-100有2人。文字信息是“作文最高分为90.7分(陈同学),最低分46.3分(穆同学)。平均分为:80.6分。
错误统计柱状图:包括总体错误文字描述“系统共从学生作文中发现399处错误。其中,拼写、句子成分为学生们最常犯的错误”。其二,错误统计柱状图。如1070070号作文错误分布数据柱状图,按照从高到低的顺序,共有17个子项。批改网用柱状图可视化了这次错误发布的总情况,最高处是拼写错误,数据为68,最低处是情态动词错误,数据为1。(图3)。错误分布子项较多,反映了学生犯错误的复杂性,与学生个人英语水平有关,更与学生态度有关。如拼写错误有68处,学生只要认真阅读,按照“警示”提示,都能够修改正确。数据告诉我们,学生修改态度需要端正,常用单词打错,或许背单词时只关注汉语意义,记错了,或打字出错;还有一点,新生不太了解英语打法,造成标点符号“不空格”错打。句子结构、主谓一致、词性误用都是中国学生常犯错误,也反映了英汉语言不同给中国学生带来的挑战,课堂讲解需要有的放矢。
“学生表现”页面包括拓展信息,排行(前十),修改排行(前十);使用四种颜色来评价每一位学生个体情况(绿色代表优秀,蓝色为良好,黄色为一般,红色为差),教师通过看色就可以直观地了解所教班级学生本次作文总体表现。可视化色彩数据方便教师分析每一位学生,还可以对比分析学生。以直观的色彩显示可视化信息,方便了教师对不同班级学生整体了解,色差更容易识别学生学习态度、表现好与一般,瞬间就可以明白这些综合信息。可视化色彩数据体现了批改网在积极深化人工智能技术,一定程度上反映了教育技术的发展方向,建构简洁省时、大信息量的教育大数据。
“浏览作文”页面:包括本次作文成绩统计,如“90分以上(2人),80-89分(98人),70-79分(50人),60-69分(8人),60分以下(1人)”。这些数据是图2的文字表述,显示每一位学生姓名、成绩,修改次数,可以点开“按句点评”查看每一位学生作文。
“相似统计”页面:一个总表显示全体159人重复率情况,按照重复率从高到低顺序显示信息,如“40%以上(5人),20-40%(9人),10-20%(20人),10%以下(125人)”。如第1070070号作文,李同学相似为79%,排在第一位;14位学生超过20%,必须重写。学生学习态度存在严重问题,必须批评教育。客观、公正的数据赋予批评力度,对于学生未来的学术规范、诚信起到了很好的警示作用。
这五个维度提供的综合信息既有图的形式也有word版的文字形式。数据概述、学生表现是图的数据,错误分布包括图和word文字信息,这些图和文字都可以十分方便地运用于课堂作文评讲,5个班学生整体表现情况可以客观、准确地在课堂一边展示,一边讲解,有理有据地教育学生,指导学用好“按句点评”,争当诚实守信的学生。
(二)课下辅导
新版批改网第二层的数据是第一层数据的再细化,包含数目不等的子项数据,为教师全面精准了解学生提供了宏观与微观的数据。
和错误分布的word版,这两种信息可以用在课堂分析,更可以用在单个学生指导。这个维度的数据明确了学生作文的薄弱点所在,为精准课下指导提供了很好的技术支持。目前,学生自适应,个别指导策略,错误诊断等一定程度上反映了教育技术的发展方向。进行数据挖掘与学习分析是国际教育技术界研究的热点,在国内的关注度也是水涨船高。与人工智能技术有机结合的批改网建构了自己的智能数据系统。从宏观视角看,错误诊断中的“错误分布”最有特色,对于教师与学生来说,最实用的一类数据就是“错误发布”。批改网提供柱状图(如上图3),数据是从整体视角显示学生作文错误分布情况。word文字版的错误评价报告,具体显示每一位学生作文错误,指出错误类型,给出修改建议。这些错误的描述对于提高课堂教学精准度、课下一对一辅导、学生自身能力的提高提供了不可或缺的技术支持,微观的文字word与宏观柱状图,结合起来为精准教学提供了可信的、证据式的技术支持。如“成长轨迹”(图4)记录了每一位学生提交历史版本。
点开具体一位学生成长轨迹,教师可以看到这位学生每一次修改情况,分数变化,提交时间变化,可以精准指导学生正确修改作文,而不是2秒,3秒修改一处就提交,看成绩变化。这反映了学生投机心理,想高分,又不愿意多花时间修改。对于修改次数过多的学生,查看历史版本,可以精准辅导学生,对进步给与中肯的指导。对于投机学生,批评浮躁行为,指导合理修改。
(三)学术研究
新版批改网后六个维度“词频、搭配、分级词汇、数据比对、维度分析、检索”也包括数目不等的子项,如“数据比对”包含“单词统计比对、词性分布比对、搭配统计比对、句长分布比对、动词频次比对”五个子项。如单词统计比对,显示一位学生与全体学生比对情况,也可以将这位学生与剩下的158位学生任意一位比对,同班的,不同班的。有柱状图和统计表两种数据。将六个子项数据归为微观层面是因为课堂讲解受学时限制,无法精细到这种深度,但对于深层次学术研究有意义。
从带色柱状图、曲线图、饼图数据到文字说明都显示批改网在程序设计更加精细,智能化。只要我们这些用户能明白数据价值,进行数据挖掘,课上课下合理使用这些图和表进行学习分析,就能克服数据适应性较差,交互性不强的弊端。
二 数据挖掘与学习分析技术对教与学的指导作用
大数据时代与智慧教育模式到来,教育改革对一线教师提出了新的挑战,活动与任务的教与学模式不再是单项输入,而是倡导以学生自主学习为中心的学习活动的开发与实施。现代教育活动更加注重精准性、自主性、个性化和多元化。对于教师来说,只有自身具备教育技术较高能力,积极参加教育技术培训,在实践中不断地探索,不停地更新理念,才能不落伍,较好地实现角色转变,成为教学与学习资源的组织者,过程的设计者,行为的引领者,才能满足教师职业素质的重要标准的要求。
随着2012年10月美国教育部发布Enhancing Teaching and Learning through Educational Data Mining and Learning Analytics:An Issue Brief报告以来[4],学界对数据挖掘和学习分析技术日益重视,作为教育“大数据”分析应用的两个方向,是一个起步晚、发展快的学科,技术赋权学习(Empowering Learning through Technology)[5]已经成为当前教育信息技术化领域新的研究路径和变革学习的新路径。
关于学习分析概念的理解,学习分析领域专家Sismesns、LAK(International Conference onLearning Analytics and Knowledge)在美国新媒体联盟(NMC)的地平线报告(Horizon Report 2011)从不同层面进行了阐释。其中,学习分析的目的有两个突出特征:理解发生的环境、优化学习的环境,对此情景下产生的数据进行测量、收集、分析,报告[6]。国内学者何克抗更加具体化了学习分析技术的确切内涵:“学习分析技术工具,从教育领域(‘学习过程’、‘教学管理过程’中所产生的海量数据)通过收集、测量、分析和报告等方式,提取出隐含的、有潜在应用价值的、涉及‘教与学’或‘教学管理’的过程及行为的各种信息、知识与模式,从而为教师的‘教’、学生的‘学’以及教学管理提供智能性的辅助决策的技术。”[7]学习分析技术其实质是“支持实施基于证据的精准教学、有效教学,强调效率或效益的产生,强调依据科学原理指导教学活动,加强教学的科学性”[8]。
(一)对教师的教学辅导作用
批改网,已经获取并存储了巨量的有关学生写作行为的数据。无论其量化数据还是质性数据都达到了不同系统的数据结构和数据格式的较高程度的统一与共享,具有了统一的数据格式标准和信息模型,合理的数据分析模型对课堂教学以及精准管理学生具有极高的参考价值。智能决策和智能实施一体化的智能教学离不开智能技术的支持。比如,教师动态管理学生写作行为。教师可以在写作时间期内,随时阅读、批改网上提交的学生作文,当发现跑题、相似的红色提示时,进行阅读验证,事实相符合,就撤销该作文,或者点击重写,再在班级QQ群小窗通知他们重写,真正实现了实时监控。可以通过提交日期或者学生表现数据,查看谁没有提交,多少学生最后提交,谁没有完成最低修改次数。在1070070这次写作中,机工07-09班有6位学生没有提交,也没有补交,这6位学生该次作文为零分;
有25位学生在最后期限3月28提交的,在提交过程中遇到了同一个问题:多次提交不显示成功,学生QQ留言给本人,说明情况。凭借图1-4数据挖掘所获得的完整信息,LA技术高效帮助教师考察学生表现与学生态度是否积极,通过相似度比率考察学生诚信,为及时教育学生提供了根据。基于批改网数据的技术支持,进行学习分析,完全改变了传统人工批改学生作文时遇到的最大尴尬——抄袭,为教师对学生作出客观、全面、真实、快速评价提供了科学依据。大学英语合班上课,一个教师对应多位学生,根本无法满足人人批改、次次批改的要求。批改网智能评分、评价实现了教育公平和均衡发展,是教师好帮手,大大提高了反馈效率。
(二)学习分析技术对学生个性化和自适应指导作用
批改网终端消费者还有学生。作为批改网最大的用户,学生消费者体验感受也应该研究。当学生提交作文后,分数、评语、句句点评瞬间生成了。对于学生来说,不考虑跑题,初次成绩的高低意味着英语写作水平的高低,因为在学生界面“我的作文”窗口,左方为学生作文(字数,提交次数),右方有下面四项分项:分数、排名、色彩可视图(黄色词汇、绿色句子、蓝色篇章结构、浅蓝内容相关)和评语。通过QQ进行调查,学生反馈“按句点评”的指导作用最大,认为其更为实用,修改时都是按照提示进行的修改,尤其对于那些语法不太好的学生来说,帮助最大。“按句点评”方便了学生对自己进行学习分析,找出相关问题,通过多次修改,可以积累词汇、句型,同时学到符合英语词法、句法习惯的表达,从而完善自我学习的目标,提高写作与翻译能力。
三 Word版的错误分布的价值
错误分布是批改网提供的重要数据,可视化柱状图的数据(见上图3)为课堂精准教学提供科学、客观的技术支持。在另一相同数据的word版(见下图5和图6),清楚呈现具体错误,点评、修改意见,方便自我修改。教师点击隐藏,就可获取学生姓名。
错误分布数据是最实用的。无论柱状图还是具体错句的显示都为学习分析提供了方便可靠的技术支持。这类数据为教师课堂教学精准化、面对面精准辅导提供了诊断依据,方便教师用最合适的教学方法和教学策略进行错误分析。
图5中关于拼写错误的建议正确无误,start pay也是错误的,正确的是start to pay或者start paying;“our society are also had many change”,这一分句是典型的汉式英语,“are had”在英语中不存在,“have”作为状态动词,基本上不用在被动句里;“change”丢了复数,合适的表达应为“many changes have taken place/happened in our society”。错把汉语的话题当成英语的主语是许多中国学生常犯的错误,是学生学习英语的难点,也是课堂教学的重点。在进行课堂作文评讲中,除了上面的分析,还要多举例,讲解清楚汉语话题的作用,英语翻译的方法,并要联系汉语无主句一起讲解,对提高学生作文与翻译能力都是有帮助的。
图6中的点评也是合适的。英语的SVC句型也是中国学生易犯错误类型。在汉语中形容词直接跟在主语后,如我高兴,他高兴,不需要系动词be;英语必须有be,构成系表结构,SVC是英语5个核心句型之一,学生对其太熟悉,出错,反映了我们教学也存在问题,需要改进讲解方法,强调英汉言语不同,归类SVC,系统地讲解一次,避免学生再犯低级错误。当出现这类错误时,能够自己修改,提高语言自我修正意识。
新版批改网这一技术的改进,为精准面批、指导提供了技术支持,也极大地方便了课堂作文评价,老师和学生共同分享了人工智能带来的好处。随着研发时间后移,其信度与效度是值得信赖,批改网精准度一定会越来越高。对比老版,2018年的点评和建议都趋向专业化,技术支持的信度与效度在逐步提高。合理挖掘批改网数据,进行作文课堂品鉴与评讲,从面到点,从整体错误分布到具体某一位学生错句分析,不仅提高了学生修正错误的意识,而且也培养了学生批判性思维方式。合理对待批改网给出的点评,不盲目相信,积极地和同学、老师探讨,这还有助于提高中国学生沟通能力。
批改网大数据挖掘帮助教师进行学习分析,了解和掌握学生的实际学习情况,并结合学生出错的特点制定科学、合理的课堂教学策略,制定可行的错误分析教案。更为重要的一点,方便教师进行及时精准的个人辅导。不同学生对不同知识点掌握有较大的差异,需要重复或强调知识点也不一样。
批改网错误分析“报告层”很好地解放了教师身心,不用烦心修正所有学生的拼写、语法错误,为实施有效、精准的干预或必要的帮助提供了信息技术支持,“错误定制”施教将成为一种新的证据教学范式。人工批阅和机器批阅的融合,既体验了人工智能技术带来的甜处也品尝了苦处,技术的成熟是需要时间的。
四 智能技术的机遇与挑战
批改网的数据越来越丰富,智能性能越来越高,新版对师生反馈的信息都比老版详细。对于学生来说,句句点评和及时反馈提高了学生的参与意识,体验了自身在语法、词汇方面的不足之处,改错提高了预防意识,优化了学习过程。通过评语和四种颜色比例也了解个人相关问题,自己在班级的表现,为学生自我评价提供了较为客观的技术支持,利于个性化和自适应学习,从而提高英语语言表达能力。批改网发展前景是美好的,其使用价值对于良好、中等以及中等偏上的学生来说都很高。
对于教师来说,批改网面临的挑战较多。关于这个方面,不少学者都进行了深度探讨,这里不再赘述。本人只想突出两点:(1)批改网的信度与效度有了大幅地提高。在2018年5月百万同题“How to Tell Chinese Stories in English”作文中,凡是学生理解偏了,没有写“how”,都有提醒“跑题”两个红色字。本人验证了提示,准确率已经达到95%以上,机工1608班,有8为学生(8/30)只写了中国成语涉及的故事,比如龟兔赛跑、孟母搬家、农夫与蛇等,完全没有写“如何讲述”,人工阅读也是跑题。(2)批改网的错误分布的导出需要改进。目前,一次作文的导出没有实现按班导出,而是一位教师所有学生的错误总导出,1070070导出了word文字38页。大学英语教学普遍都是大班课堂,一个老师名下都有200多为学生,不利于教师合班反馈,课堂精准反馈需要人工一个一个的粘贴,太耗时。对于智能技术来说,一个指令,一种编程,就可以省去一线教师的麻烦,实现高效反馈:QQ班级反馈与课堂精准反馈。课上精准教学的新型模式构建离不开智能技术的高度发展。
五 结语
教育信息化十年发展规划(2011-2020年)明确指出:“信息技术与教学深度融合的教学模式”是高校改革的方向,英语作文批改网为大学英语大班教学提供了有效的技术辅助,是一线教师的好帮手,让根本无法实现的人人反馈,及时反馈的梦成为现实;作为一项逐步完善的智能技术,在实践教学中已经为学生提供了随时随地,灵活、个性化、自适应的信息化学习环境,也为一线教师的精准课堂讲解和线上、线下精准辅导提供了一定的技术支持。数据挖掘与学习分析技术能否与课堂深度融合,如何融合将成为教育大数据分析的重要使命,也将是构建终身学习体系、学习型社会的关键因素。
参考文献
[1]祝智庭,彭宏超.智慧学习生态系统研究之兴起[J].中国电化教育,2017,(6):1-11.
[2]李红梅.“互联网+”时代“新”学习方式的价值逻辑[J].中国电化教育,2017,(6):102-107.
[3]杨兵,卢国庆,邢宏根,等.在线学习系统数据可视化研究与实现——以测测SAT平台为例[J].现代教育技术,2017,(12):114-120.[4][7]何克抗“.学习分析技术”在我国的新发展[J].电化教育研究,2016,(7):5-13.
[5]李克琳,许之民.赋权视角下的技术变革学习——美国国家教育技术计划2017更新版之“学习”部分述评[J].现代教育技术,2018,(3):26-32.
[6]吴永和,陈丹,马晓玲等.学习分析:教育信息化的新浪潮[J].远程教育杂志,2013,(4):11-19.
[8]甘容辉,何高大.大数据时代学习分析与外语教学研究展望[J].外语电化教学,2016,(3):40-45.
关注SCI论文创作发表,寻求SCI论文修改润色、SCI论文代发表等服务支撑,请锁定SCI论文网! 文章出自SCI论文网转载请注明出处:https://www.lunwensci.com/jiaoyulunwen/8380.html