Sci论文 - 至繁归于至简,Sci论文网。 设为首页|加入收藏
当前位置:首页 > 教育论文 > 正文

大数据时代统计软件课程教学内容的选取研究论文

发布时间:2021-04-17 16:30:14 文章来源:SCI论文网 我要评论














SCI论文(www.lunwensci.com):

摘要:本文研究大数据背景下统计软件课程教学内容的选取问题,从统计理论方法、统计软件的选取、大数据处理和分析、统计案例的引入四个角度对统计软件课程教学内容的选择进行了探讨,其结论可作为开设这门课程的同行在制定教学方案时的一个参考。

关键词:大数据;统计软件;内容选取;R语言

本文引用格式:郭丽莎.大数据时代统计软件课程教学内容的选取研究[J].教育现代化,2019,6(85):307-308.

统计软件课程开设的目的是让学生通过学习,能够掌握并熟练应用统计软件处理实际问题,比如进行数据处理、统计模型分析等,为将来专业领域的实际工作或继续深造打下基础。随着大数据时代的来临,数据分析已远不止简单的图表分析,统计软件已成为分析数据的必备工具。

然而目前国内高校统计学专业的统计软件课程没有统一的教学内容,讲授的统计软件也多种多样。如何选择合适的教学内容,使所培养的学生符合大数据时代的需求,是统计学教学研究的一个重要且具有现实意义的问题。

一 统计软件课程的教学特点及主要内容

统计软件课程是统计学相关专业学生的专业必修课之一。其特点是不以数学理论和推导为主,而是在学生了解统计分析的基本概念和基本理论的基础上,介绍各种统计分析方法的基本原理及软件操作。该课程主要以常见统计软件SPSS、SAS及R为主要教学工具,让学生掌握利用统计软件处理实际数据的能力。

该课程的主要内容包括两大部分:一是统计理论与方法,包含数据预处理、描述统计分析、推断统计、多元统计、时间序列等。二是统计软件的应用,主要讲述SPSS、SAS及R的使用方法,并对实际数据进行分析。

二 统计软件课程存在问题及分析

由于大数据时代的到来,利用计算机对数据进行处理分析是数据研究的必备技能,因此统计软件课程在当前高校社会学、经济学、统计学等学科课程教学中占据着非常重要的位置。但是作为一个客观事实,统计软件这门课程对于部分学生而言是比较困难的,尤其是对于文科背景的学生。然而这门课程不仅仅培养学生的专业知识,更是对学生技术水平及综合素质的一种提升。但从教学考核方面来看,当前学校教学制度对教师教学效果的考核往往是以结果考核方式为导向,因而也就限定了老师的教学内容以及考核范围,这无疑不利于这门课程发挥其在人才培养方案中的作用。为解决这些问题,我们认为对统计软件这门课程的改革,应该从该课程的教学内容选取开始。有了合适的教学内容,才能进一步制定合理的教学大纲及方案并提高教学效果。

三 教学内容的选取方案探讨

(一)统计理论与方法的选择


通常的统计学本科教学培养方案中,对统计理论与方法主要要求学生掌握描述性统计分析、统计推断、多元统计、时间序列等。然而在有限的教学学时内,将上述内容都讲精讲透是几乎不可能的,因此必须要有所侧重。笔者认为,在如今的信息时代,将理论知识进行计算机可视化是一种趋势,因此描述性统计分析的重要性更加不言而喻。

描述统计是描绘或总结观察量的基本情况的统计总称。描述统计学研究如何取得反映客观现象的数据,并通过图表形式对所收集的数据进行加工处理和显示,进而通过综合概括与分析得出反映客观现象的规律性数量特征。透过对于数据资料的进行图像化处理,将资料摘要变为图表,以直观了解整体资料分布的情况。通常会使用的工具是频数分布表与图示法,如多边图、直方图、圆形图、散点图等。

\

 
由于描述统计分析具有以上特点,因此在实际应用中比更偏于理论的统计推断结果更易于被大众接受,所以我们认为在介绍统计理论与方法时,应侧重于描述性统计的理论和方法。

(二)统计软件的教学选择

目前,国内高校统计学专业的统计软件课程没有统一的教学内容,讲授的统计软件也多种多样。大部分高校主要讲授SAS和SPSS等,少部分院校讲授R软件。

SAS是英文Statistical Analysis System的缩写,翻译成汉语是统计分析系统。然而,由于SAS系统是从大型机上的系统发展而来,其操作至今仍以编程为主,人机对话界面不太友好,系统地学习和掌握SAS,需要花费一定的精力。SPSS是英文Statistical package for the social science的缩写,翻译成汉语是社会学统计程序包。SPSS系统特点是操作比较方便,统计方法比较齐全,绘制图形、表格较有方便,输出结果比较直观。SPSS是用FORTRAN语言编写而成。适合进行从事社会学调查中的数据分析处理。

而当今社会是数据爆炸的时代,在大数据背景下,R软件在功能与产品线齐全上远超SPSS,与SAS不相上下,国内外近十年开始广泛普及。应用R软件进行数据挖掘,建立统计模型并求解,是十分重要的技能,有着相当广泛的应用。一般而言,R具有以下一些特点:首先R语言便宜,开源软件,完全免费,完全开放,免费保证了其低成本,而开放保证了高质量,新的统计方法很快得到应用并开放为package供人们使用。其次,开放使其统计分析功能完善。第三,作图功能极其强大。第四,作为一门程序语言,可在不同机器和环境中应用,使用灵活。基于R的以上优势,我们建议在进行统计软件的教学时,应侧重于对R的介绍。

(三)引入数据处理的内容

对于真实数据,往往存在各种各样的问题,比如缺失值、异常值、不一致的值、重复数据及含有特殊符号的数据如*、#等等,因此我们首先需要对这些数据进行分析和处理。尤其是面对大数据的情形,学生往往不知道从哪里入手,即便知道要对缺失值、异常值等数据进行处理,也不知道如何编写代码来快速高效地完成。

在对数据进行质量分析之后,还需要进行数据特征分析。比如区分定性数据、定量数据,了解每项数据的单位和含义。对于定性数据,可用饼图和条形图直观地显示分布情况。对于定量数据,可以计算相关统计量,绘制频率直方图、茎叶图、箱线图等分析其分布形式。

此外,在对大数据进行分析的时候,往往需要读写数据库,因此需要引入用R软件读写数据库的内容。如果学生前期开设了数据库的课程,那只需要讲授如何编写R代码读写数据库。如果学生未开设相关课程,则需要补充一定的数据库基础。

(四)统计案例的选取

除了理论知识的介绍,笔者认为应该引入实际案例,即针对真实数据,应用统计知识和方法求解实际问题。

首先,针对每一章节知识,选取相对应的案例。比如,对于线性回归模型、非线性回归模型、logistic回归模型,可以分别选取三个较为简单的案例,给出数据,让学生运用上述模型求解。对于聚类分析,可以选取两个案例,讲解不同的聚类方法。对于因子分析和主成分分析,可以合并起来选取一个案例。对于分类与预测模型,比如神经网络、支持向量机、决策树、随机森林、灰色预测模型、GBM模型,可以各选取一个案例,也可以用这几种方法分析一个案例。对于关联规则算法,协同过滤算法,Lasso算法,文本挖掘模型、时间序列模型等,我们可以分别讲解相应的案例。

其次,在讲授完基本的模型和算法之后,我们可以选取一些较为大型的、综合性的案例。例如,对于企业大用户的用电负荷数据,我们可以采用神经网络和CART决策树模型来自动识别窃漏电用户。在对餐饮企业进行综合分析时,我们可以同时应用多个模型,即使用ARIMA时间序列模型来预测销售额,使用协同过滤算法对菜品进行智能推荐,使用Apriori算法对菜品进行关联分析,使用K-Means算法进行客户分群,使用决策树算法进行客户流失预测。再比如,在财政收入预测分析中,我们可以综合运用相关性分析、Lasso模型选取特征、灰色预测模型、神经网络和支持向量机。对于电商产品评论数据,我们可以对文本进行基本的预处理、中文分词、停用词过滤,然后建立栈式自编码深度学习、语义网络与潜在狄利克雷分配(LDA)主题模型等,来分析文本评论数据的倾向性以及所隐藏的信息。最后,我们可以适当地引入一些竞赛题目,如全国统计建模大赛赛题,“泰迪杯”全国数据挖掘挑战赛赛题等,一方面调动学生的积极性,学以致用,另一方开阔学生的视野,为参加学科竞赛打下良好的基础。例如,2019年第七届“泰迪杯”数据挖掘挑战赛B题:直肠癌淋巴结转移的智能诊断,需要用到读取数据、神经网络模型、图像分割、特征提取、变量选择、支持向量机、随机森林等,也可以进一步地提高,运用Stacking集成模型等。

四 总结

统计软件这门课程在大数据时代的背景下,对统计学人才的培养起到非常重要的作用。我们认为教学内容的选取是这门课程教学改革的一个关键因素,既要培养学生分析和处理数据的能力,又要使学生能够适应当今大数据时代统计学的发展和社会的需求。因此,我们必须变革传统的教学方式,即只讲授统计软件的基本操作方法和基本知识,这会使得学生无法适应现今企业对大数据处理和分析人才的需求。综上所述,我们建议统计软件课程,应该恰当地选择统计理论和方法,选用R软件,并引入大数据处理和分析的内容,选取一定的实际案例,来拓宽学生的知识面和动手能力,希望我们的一家之言能对同行们起到一定的参考作用。

\

 
参考文献

[1]丁娟.关于高校统计软件课程教学改革的思考[J].现代职业教育,2016,19:147.
[2]张璇,张小慧.统计软件课程教学改革的探索与实践[J].科教文汇,2013,5:51-53.
[3]江海霞,王成,杜涵蕾,等.“统计软件与应用”类课程教学模式改革探讨[J].教育现代化,2017,7:37-38.
[4]顾光同.《统计软件》课程教学改革的探索与实践[J].教育现代化,2018(1).
[5]杨宜平,赵培信.R统计软件在统计教学中的应用[J].重庆工商大学学报,2013,30,3:74-76.
[6]徐付霞,李亚威.基于统计软件R的《数理统计》实验教学案例[J].高等数学研究,2018,1:61-64.

关注SCI论文创作发表,寻求SCI论文修改润色、SCI论文代发表等服务支撑,请锁定SCI论文网!
文章出自SCI论文网转载请注明出处:https://www.lunwensci.com/jiaoyulunwen/30207.html

发表评论

Sci论文网 - Sci论文发表 - Sci论文修改润色 - Sci论文期刊 - Sci论文代发
Copyright © Sci论文网 版权所有 | SCI论文网手机版 | 鄂ICP备2022005580号-2 | 网站地图xml | 百度地图xml