Sci论文 - 至繁归于至简,Sci论文网。 设为首页|加入收藏
当前位置:首页 > 教育论文 > 正文

数据科学与大数据技术专业统计学课程的教学探索论文

发布时间:2021-08-16 14:15:27 文章来源:SCI论文网 我要评论














SCI论文(www.lunwensci.com):

摘 要:针对统计学课程定位不准、教学设计不到位的状况,从数据科学与大数据专业的人才培养目标与专业特色出发,分析了课程内容与教学方法等方面的不足,提出了“技术为先、应用为本”的教学理念,并在后续教学过程中积极探索,取得了显著效果。

关键词:统计学;数据科学与大数据专业;技术为先;应用为本;教学探索

本文引用格式: 李建敦,吕品,肖薇 . 数据科学与大数据技术专业统计学课程的教学探索 [J]. 教育现代化 ,2021,8(40):47-50.

Teaching Exploration of Statistics Course for data Science and Big data Technology major
LI Jiandun, LV Pin, XIAO Wei(School of Electronic Information Engineering, Shanghai Dianji University, Shanghai)

Abstract: In view of the inaccurate positioning of statistics course and inadequate teaching design, starting from the talent training objectives and professional characteristics of data science and big data major, this paper analyzes the shortcomings of course content and teaching methods, puts forward the teaching concept of "technology first, application-oriented", and actively explores in the follow-up teaching process, which has achieved remarkable results.

Keywords: statistics; data science and big data major; technology first; application oriented; teaching exploration

一引言

大数据时代已经到来。据权威机构预测,据TDU 研究显示,2025 年前我国数据人才缺口将达到200 万。为了有效应对,截至 2020 年 3 月,教育部分五批同意中国人民大学、上海电机学院等 486 所本科院校开设“数据科学与大数据技术”专业(以下简称数据专业)[1]。如何办好这个新型专业以解决用人市场难题,特别是如何上好人才培养中的每门课,是一线教师普遍关注的议题。

作为经典学科,统计学的历史至少有一百五十多年。统计学源于概率论,其目标是以数学方法来描述或推测变异事物或现象的本质及其发展,其应用几乎覆盖了社会科学和自然科学的各个领域 [2]。在大数据时代,如何设计、搜索、整理、分析、描述并利用海量数据资源,是主旋律。而这些环节基本都建立在统计学这一基础上,因此,统计学便成为了各大高校数据专业的必修课,特别是机器学习、数据挖掘与人工智能等核心专业课的先行基础课。

\
 
然而,该课(课程名为“大数据分析统计基础”)在上海电机学院首批数据专业的授课效果并不理想(最高分91,最低分0 分,平均分63.97,难度系数0.36,成绩分布见图 1),督导反馈课堂难度较大,学生评教分为 88.9,低于学院学期平均分 92.1。总结下来, 突出问题主要有两个,即课程定位不准、教学设计不到位。

在互联网与大数据背景下,如何提升统计学课程的教学质量,已有多种研究与探索。高书丽等 [3]提出要从教学内容重构、教学方法改革、实践内容加强、教师知识更新等方面全面升级,特别是要结合 MOOC、微课等新型教学模式。李国成等 [4] 强调统计学要面向专业进行重构,我们深表赞同。苗建花等 [5] 提出要充分利用线上、线下混合教学模式, 同时加强过程考核。王小刚 [6] 运用了翻转课堂与启发式教学方法。在前人丰富教学研究成果的基础上, 本文首先从我院数据专业的人才培养目标出发,剖析问题成因,并在此基础上有针对性地提出了一些改革方案。

二 成因分析

鉴于首次授课的问题总结,我们分别从课程(即《大数据分析统计基础》)与学生(工科,数据专业, 第 3 学期)两个角度,来剖析问题成因。作为新办工科专业,我院数据科学与大数据技术专业的培养目标,是培养高等技术应用型人才, 以使他们能够胜任大数据平台规划、大数据技术应用、大数据分析、大数据可视化以及大数据管理与运维的相关工作。这与面向大数据的分析师、挖掘师或算法师是有显著差异的。当前,专业培养计划中强调了基础语言的熟悉与应用平台的掌握,而不是机器学习模型或数据挖掘方法的推导、验证或改进。

因此多种抽样的对比与改进、极大似然估计的推导、Box-Cox 变换的验证、独立成分分析算法的分析等内容就偏离了“应用”这个主方向。在这样的人才培养目标导向下,《大数据分析统计基础》应当强调统计基础的掌握与统计思维的培养,以为即将开展的大数据分析做好准备。因此,描述性统计分析部分,特别是面向大数据的采样、预处理与可视化是重点;同时,为了对接机器学习的相关模型,推论统计部分可以概括地讲,但不宜展开, 比如极大似然估计、主成分分析、线性回归、支持向量机、K 近邻等。而在首次授课时,过分沉醉于经典统计学的完整性,未能根据专业特色进行调整。

在培养计划的设置上或课程的推进中,授课团队亦缺乏有效沟通。统计学的先行课——概率论部分是安排在《应用工程数学 B》偏后部分执行的, 而且该课与《大数据分析统计基础》是并行开课的, 因此部分内容对概率基础不充分的学生来讲,是吃力的。为了让多数学生彻底理解概率分布、参数估计、假设检验等概念,课余时间甚至一些课堂时间被用于补基础。凭空多了一门数学课,加重了学生学习负担,也伤害了学生的学习积极性。

课程在教材选用上亦有改进空间。首次授课选用的是北京大学出版社面向研究生的教材《大数据探索性分析》。该教材内容详实,而且难度颇高,比如缺失值处理、异常点检测、投影寻踪、独立成分分析、空间数据分析等,适合模式识别等相关专业或人工智能方向的研究生,对于应用型本科低年级学生来说具有相当高的挑战性,况且我们只有区区32 学时。另外,实践部分选用经典 R 语言而不是学生熟悉的Python,它偏数学表达、近 MATLAB 的风格,让偏计算机培养方案的学生很不适应,需要付出较大精力方能驾驭。

受教学内容影响,首次授课更注重面的扩展, 知识的传递,未能完全做到以学生为中心。由于内容精深,主要采用教师主讲、学生互动、课后习题的传统授课方式,辅以网络、论文等前沿知识,实践主要以学生课下自主练习为主,未设置课内实验或大作业。致使多数学生对本课兴趣不高,也出现了两级分化现象。自我意识和自主能力强的同学, 通过课外练习、教师辅导答疑等途径提升较快,但大部分学生只求 60 分自保, 对知识不求充分理解, 更谈不到在具体问题中的应用了。

\
 
三 改革实践与典型示范

针对首次教学中存在的问题,我们再次梳理了专业培养目标与计划,重点剖析了课程定位,详细摸排了知识点,并在此基础上提出了“技术为先、应用为本”的改革方针。具体地,我们优化了教学大纲、授课计划与课内外实验,着重设计了教案与多媒体课件。具体改革有以下三个方面。

(一) 改革教学内容
教学大纲是课程的指挥棒。在应用型人才目标的指引下,面向工业大数据应用相关岗位,我们首先从教学内容上进行了改革,包括知识点的调整、难度的协调与先行课的配合等。

1.调整课堂知识点
在数据生命周期中,《大数据分析统计基础》主要涉及到数据采集、数据预处理、数据描述与数据分析这些阶段,而其中的分析并不是机器学习中的预测,却是为了理解数据。鉴于当前数据处理框架与自动化工具的大力发展,应用型数据类岗位基本以集成框架为主,辅以参数调整或 API 调用就可实现整套应用逻辑。因此对于数据分析的模型或算法, 大多数学生来说做到知其然即可,而不必追求推导、评估、验证或优化。在此基础上,调整了课堂需主讲的知识点,其中删除部分可作为拓展内容由学生自学,以应对大作业的要求(见表 1)。

2.优化重点与难点
统计学基本可分为描述性和推论性两部分。在首次授课过程中,考虑到为后续课程,如机器学习、数据挖掘等提供统计基础,因此推论部分着了浓墨重彩,而描述性部分被低估了。然而,由于机器学习的目标是泛化能力,而统计本身并不涉及未知数据, 只强调拟合能力,因此机器学习对于统计这个基础, 或可解释性的基础并不过分看重,附了部分分类器, 如支持向量机(SVM)等。同时,由于参数估计、假设检验等内容已经在概率论与数理统计课程中讲过, 因此推论统计部分并不需要过分剖析原理。

相对地,由于数据采样、预处理与可视化是大数据分析的基础,而实际工作中,通过调用 API 来实现这些操作是经常会遇到的,因此需要学懂、弄通并熟悉如何设计数据、操纵数据与清洗数据等。同时, 由于面对的数据量是海量的,需要在大数据框架中培养统计思维,因此大数据采样、探索性数据分析、数据集成、数据降维等部分,需要通过课上讲、案例学、课下练、网上追等多种渠道来加强。另外,课程主教材已经调整为更适合数据专业的国外经典《面向数据科学家的实用统计学》。

3.协调先行与后续课程
《大数据分析统计基础》授课质量的提升,离不开先行课的基础,特别是概率论与数理统计。经过与《应用工程数学 B》相关教学团队沟通,已取得了提前教授此部分的共识,以避免在统计学课程上大量补课的现状。另外,也与后续课程进行了对接,明确了统计学要为数据分析提供哪些支持。总体来讲,主要是数据理解层面,包括参数比较、相关性分析、独立成分分析等方面。

(二) 强化实践
首次授课质量堪忧的一个重要现象是, 计算题成为了多数学生的绊脚石。通过分析发现,课堂缺乏案例讲解、课后缺少实践是主要问题。为此,我们提出了课堂加强案例教学、课后着重团队实践的方案。

1.丰富典型案例
以数学为支撑的统计学并不好学。为了方便学生深入概念理解、熟练工具运用,丰富案例素材、提升针对性是此次实践改革的重点。结合任务驱动和以学生为中心的教学方法,在基本概念主讲的基础上, 大力推广案例式教学,主张点大于面的思想,让学生沉浸其中,而不是大范围的知识传递。面向大数据的典型案例包括人口和谋杀、观影记录、商品评论、重装设备健康数据等。

2.强化大作业
由于《大数据分析统计基础》学分为 2.0,未设置课内实验,因此课后大作业对于学生动手能力的锤炼尤为重要。在先进教学方法,如深度学习与任务驱动的框架下,设置了团队作业,比如婴儿出生登记姓名的数据处理与可视化、观景记录与智能推荐数据统计分析、商品评论数据处理与垃圾识别、机床传感器数据统计与故障预警等。

3.优化实践平台
除提升实践占比外,实践平台也很重要。在首次授课中,数据采集、清洗与分析都绑定在 R 语言上, 形式单一,而且与学生普遍熟知的 Python 差异较大。此次改革中,采用 Python 为主的多元化实践平台, 包括 Excel、Power BI、SPSS 等。比如面向 Excel 的数据采集、数据清洗、数据统计与可视化。

\
 
(三) 优化教学方法
在首次授课过程中,课堂教学主要以教师主讲、辅以师生互动为主。这种方式能够最大化知识面,保证教学进度。实践过程中,不仅描述统计与推论统计得以全覆盖, 而且学生未及时学到的概率论基础也得以在课堂补充。但是由于课程侧重点是向北京大学等科研高校看齐,因此模型、算法的讨论太过深入,弱化了学生的学习兴趣,同时也影响了课程质量。在改革大纲与知识点的前提下, 我们同时也研究并优化了原有的教学方法,主要是面向案例的任务驱动法与面向大作业的团队协作法(如图 2 所示)。

作为建构主义学习理论的一部分,任务驱动式教学强调问题导向,注重以学生为主体来构建知识树 [7]。它的实施一般需要四个步骤,即设置情境、确定任务、自主学习、效果评价。该方法的应用,理论上能够在课堂上让学生在实际问题的直接驱动下, 产生强烈的学习与探索欲望,并在问题不断地冰消瓦解过程中获得成就感,以激发他们的求知欲望,放大知识与能力对他们的刺激,逐步形成一个感知心智活动的良性循环,从而培养出独立探索、勇于开拓进取的自学能力。

课外实践或大作业的模式虽然传统,但是对于缺乏动手能力与团队协作能力的学生来讲依然重要。特别是考虑到工业大数据的应用领域,没有哪个企业或个人能够在市场上“单打独斗”,因此集体至上的精神、与人沟通促成协作的能力都是我们的培养目标。改革中,根据团队少而精的理念,以2-3 人为一组, 从拟定题目中选择或自选统计题目, 以分工合作方式按时保质完成。组内设置组长一名,采用组长负责制,并在考评时进行打分互评。评估环节分为 PPT报告、项目演示、个人答辩与结题报告等部分,成绩计入总评。

四 结语

针对数据科学与大数据技术专业中统计学课程质量不高的问题,本文从内容重构、实践加强与方法提升等方面, 有针对性地提出了一些改革方案。新一轮的授课实践中,学生平均成绩上升 11 个百分点,学生评教上升 3 个百分点,表明这些改革方法是可行且有效的。当然,授课实践中也发现了一些新问题,比如个别学生兴趣不高,个别团队协作程度不够等,将在调查研究的基础上逐步改进。

参考文献
[1]教育部 . 教育部关于公布 2017 年度普通高等学校本科专业备案和审批结果的通知
[2]耿直 . 大数据时代统计学面临的机遇与挑战 [J]. 统计研究 ,2014,34(1):5-9.
[3]高书丽 , 王宝花 . 大数据背景下经管类专业统计学课程教学改革研究 [J]. 教育教学论坛 ,2020(11):144-146.
[4]李国成 , 赵攀 . 大数据时代下经济类统计学课程教学改革研究[J]. 滁州学院学报 ,2018(2):105-107.
[5]苗建花 , 韩兴国 , 宋君丽 . 大数据背景下统计学课程混合式教学模式的探索与实践 [J]. 西部素质教育 ,2020,6(03):111-112.
[6]王小刚 . 启发式教学在《统计学》翻转课堂中的实践与探索 [J]. 中国多媒体与网络教学学报 ,2020(2):175-176.
[7]吴立强 , 杨晓元 , 吴旭光 , 等 . 基于任务驱动和深度学习的信息安全课堂教学实践研究 [J]. 计算机教育 ,2020(3):4-6.

关注SCI论文创作发表,寻求SCI论文修改润色、SCI论文代发表等服务支撑,请锁定SCI论文网!

文章出自SCI论文网转载请注明出处:https://www.lunwensci.com/jiaoyulunwen/32405.html

发表评论

Sci论文网 - Sci论文发表 - Sci论文修改润色 - Sci论文期刊 - Sci论文代发
Copyright © Sci论文网 版权所有 | SCI论文网手机版 | 鄂ICP备2022005580号-2 | 网站地图xml | 百度地图xml