Sci论文 - 至繁归于至简,Sci论文网。 设为首页|加入收藏
当前位置:首页 > 教育论文 > 正文

数据科学与大数据技术专业的研究方向及学生培养初探论文

发布时间:2021-05-26 13:56:26 文章来源:SCI论文网 我要评论














SCI论文(www.lunwensci.com):

摘要:数据科学与大数据技术专业是近几年发展起来的专业,专业建设、人才培养等各方面需要不断完善。为加强对数据科学与大数据技术专业的研究,在简述数据科学概念的基础上,分析了数据科学与大数据之间的关系,探讨数据科学与大数据技术专业的研究方向,提出本专业在培养本科学生的3个阶段并总结本专业发展面临的问题。

关键词:数据科学;大数据;专业;培养学生

本文引用格式:张京京,等.数据科学与大数据技术专业的研究方向及学生培养初探[J].教育现代化,2020,7(45):32-35.

Research Direction and Students Cultivating of Data Science and Big Data Technology

ZHANG Jing-jing,LI Zhi-gang

(College of Information Science and Technology,Shihezi University,Shihezi Xinjiang)

Abstract:Data science and big data technology is a new major,major construction,students cultivating and other aspects need to be constantly improved.This paper is based on a brief introduction of data science,the relationship between data science and big data is analyzed,several research directions of data science and big data technology is discussed,this paper puts forward several stages of cultivating college students.Finally,the problems faced by the development of this major are summarized.

Key words:Data science;Big data;Major;Cultivating students

一引言

伴随着大数据时代的到来,人们开始意识到大量数据的背后有一个科学的体系即数据科学。大量数据扑面而来,在当今社会,大数据技术已经普遍在各个领域用于智能推荐、智能预测、智能分类等,但是关于数据科学的理论研究还远远滞后于它的实际应用,是典型的由实际应用推动理论研究,例如在未建立数据科学理论体系之前,数据科学便在2012年应用于美国总统大选的预测工作中,受到广泛关注。因此,国内外众多高校重视并开设数据科学与大数据技术专业。2019年教育部公布了《教育部关于公布2018年度普通高等学校本科专业备案

和审批结果的通知》,仅2019年新增的数据科学与大数据技术专业的学校就有196所,目前为止,教育部公布的四个批次中累计开设此专业的高校有479所[1]。尽管开设数据科学与大数据专业的学校不断增多,但是,建设什么样的专业以及如何建设该专业仍为各高校面临的难点问题[2]。朝乐门[3]在调查分析世界一流大学中数据科学专业培养方案的基础上,重点分析了数据科学专业中开设的特色课程,探讨了其对我国数据科学专业建设的借鉴意义;王萌[4]、宋晖[5]、樊迪[6]等人探讨了数据科学与大数据技术专业的课程建设。同时,也有较多关于数据科学和大数据的书籍出版,可见,数据科学的理论研究正在逐渐发展。数据科学与大数据技术专业是一个交叉学科,需要掌握多门理论基础课程,同时在不同的研究方向上又有所侧重,因此,为充实数据科学理论研究,在介绍数据科学与大数据技术专业的基础上,分析数据科学与大数据专业的几个细分的研究领域,初探此专业培养学生的几个重点阶段,最后提出此专业目前面临的几个问题,以期本专业的教师在培养学生的时候能够根据自身研究的方向,有针对性的培养学生,形成专业特色,避免国内外课程的相互借鉴而造成专业设置混乱,本科学生专业知识不扎实、不连贯的现象。

二 数据科学及其与大数据的关系

(一)数据科学简述


目前,没有对数据科学权威的定义描述,从一些数据科学导论类书籍来看,数据科学是一门以“数据”,尤其是“大数据”为主要研究对象,并基于数学统计、机器学习、计算机技术为理论基础,结合某一领域,研究数据的采集、清洗、存储、分析、可视化等活动的交叉性学科,是面临新挑战、新思维和新方法的理论、方法、模型、技术等一整套知识体系[7,8]。在信息时代,大量的数据被赋予含义而产生信息,再根据这些信息提炼出事物发展的规律形成知识,决策者根据这些知识处理事务,积累经验形成智慧,用于日常的生产当中[9]。而在大数据时代,数据有了直接的价值,不再需要把它转化成信息再转化成知识便可以直接用来解决问题,而是直接基于数据解决问题[10]。运用Hadoop生态圈工具、R和Python等数据科学语言直接对数据进行一系列的操作,而不需要对数据进行归纳总结形成一般规律后再去解决问题。

\

 
(二)数据科学与大数据的关系

近几年,众多媒体和领域专家都热衷提出大数据,面对大量的数据和复杂的业务,人们期望有一种全新的解决方案和工具,因此,乐于将复杂又难以解释清楚的业务“寄托”于大数据。人们所称道的大数据,包括了两个方面,其一,它是一种大量数据出现在我们工作生活中的现象;其二,它是一种处理大量数据的技术和工具。人们往往先是发现了“现象”,之后提出这种现象背后所蕴含的规律,并给出量化的指标,比如公式或者定律,这是科学的本质[11],同样,大数据现象背后的本质是数据科学。

大数据技术包括Hadoop生态圈在内的一系列数据收集、存储、计算、可视化的工具,学习大数据技术的计算机基础是Linux、SQL、Java,因为大数据技术工具是运行在Linux系统之上,SQL数据库语言能够运用在大多数的Hadoop生态圈中的数据库工具中,而Hadoop生态圈中的工具往往需要Java语言进行编程,Hadoop本身也是由Java语言编写。数据科学是研究大数据的一套科学的体系,不仅仅包括使用大数据技术对数据进行操作,也包括了统计学、数学、机器学习在内的理论基础,同时数据科学有自己的基础理论,如数据科学的理念、原则、方法、技术、工具等,在此基础上进行数据的收集、清洗、存储、分析、可视化。由此可见,大数据并不能代表数据科学,数据科学与大数据有很大的区别。

三研究方向及学生培养的几个阶段

(一)数据科学与大数据技术专业的研究方向


数据科学与大数据技术专业是一门交叉学科,不同于传统的统计学也不同于计算机科学,它更不是两者的简单结合,而是一门在统计学、数学、计算机科学和机器学习的基础上的一门学科。在一定的理论学习的基础上学习数据科学引论、数据获取与数据清洗、数据组织与管理、大数据技术基础、数据分析与可视化、机器学习等专业课程。因此,要掌握的课程较多,而教师和学生的时间和精力均有限,很难做到样样精通,需要针对不同的研究方向有所侧重。由于数据科学与大数据是一门新兴的学科,还在不断的发展中,因此,没有绝对的标准,不同的学校可以根据培养目标的不同,制定适合本专业发展的人才培养方案。

根据不同高校的人才培养方案和数据科学的内涵,将数据科学与大数据技术专业分为以下几个研究方向。(1)人工智能方向。人工智能主要研究如何用人工的方法去模拟和实现人类智能,人工智能包含了机器学习和深度学习,机器学习是早期研究数据科学的关键技术,使得机器能够以有效的方式从数据中学习。目前来看机器学习和深度学习较为热门。人工智能的研究基础是知识表示和推理、人工神经网络等。(2)大数据技术工具使用方向。以Hadoop生态圈工具为主的一系列对数据的收集、存储、分析和计算,强调对此类工具的熟练掌握和使用,能够熟悉相关工具的编程语言,如分布式文件系统HDFS、分布式计算Mapreduce、资源调度Yarn的使用和编程,此方向偏重于实践,也是目前一些培训机构培训大数据技术主要学习的重点,强调学生的动手能力及工具的使用。大数据技术工具的使用,尤其是Hadoop生态圈工具,可以应用到各个研究阶段,如图1。(3)理论基础研究方向,专注于数据科学与大数据的理论基础,如统计学,计算机基础,离散数学,概率论等,统计学是数据科学早期的数据分析工具,需要说明的是它是数据科学的理论基础而非核心内容。(4)数据获取与数据预处理方向,专注于数据的采集和爬取,并对数据进行预处理,针对错误数据、无关数据、数据类型等进行处理。(5)数据存储与管理方向,专注于数据的分布式存储,研究其存储结构,存储工具的使用等,如Nosql工具的运用。(6)数据分析、计算与可视化方向,使用R或Python语言进行数据分析和可视化,使用Spark等语言进行分布式计算和数据处理,专注于对数据的分析、分布式计算和对获取的数据进行可视化。


\


(二)数据科学与大数据技术专业学生培养的3个阶段

数据科学与大数据技术专业在培养学生时需要注意因材施教,针对不同的培养目标制定符合本专业的人才培养计划,根据不同的研究方向,有侧重的进行培养。可以分以下几个阶段进行培养。(1)理论基础阶段。理论基础阶段包括通识教育课程和专业基础课程。一方面,通识教育类课程旨在培养学生的综合能力,本专业重点的通识课程为自然科学类的课程,如高等数学、概率论与数理统计、线性代数等,这些课程在后续的专业核心课程中起到重要作用,很多算法、逻辑推理、统计应用等需要以这些课程为基础,并揉入其中,若没有打好数学基础则在后续的课程学习中理解上会存在困难,导致学生跟不上教学节奏,失去学习兴趣。另一方面,学习数据科学与大数据学生需要打好专业基础,开设计算机科学中的一些课程,例如Linux操作系统、Python语言、应用统计学、数据结构与算法、数据库系统等。本专业是一门交叉学科,计算机科学是专业的基础,数据的采集、分析、处理均需要使用计算机软硬件来实现,学生在此阶段需要掌握使用计算机软硬件相关知识。(2)基础理论阶段。此阶段注重将学生领进数据科学与大数据的大门,建立学生对此专业的全局观,能够对此专业的理论、方法、工具有一个全面的认识,并能够对数据科学与大数据所研究主要内容、基本流程、典型应用等有所认识,掌握大数据技术工具的工作原理,并了解数据科学项目的管理知识等。主要的课程是数据科学引论或数据科学与大数据导论、大数据技术基础、数据科学项目管理等。(3)专业课程阶段。这个阶段是培养学生的重点阶段,从数据收集、预处理、存储、分析、可视化几个方向设置专业课,如数据获取与数据清洗、数据存储与管理、数据分析与可视化、人工智能基础等。学习每个方向的重点理论内容并使用相关语言和工具进行实践,引导学生找到自己感兴趣的方向,学生针对自己感兴趣的方向深入学习,开展课程设计、工程实践等,在掌握相关理论的基础上,熟练使用相关的技术工具和语言,以实际的项目案例为切入点,建立“边学边用,边用边学”的学习理念,增强学生的动手能力,以满足社会需求。

四 数据科学与大数据技术专业目前面临的几个问题

2012年哥伦比亚大学开设第一门数据科学课程《introduction to data science》标志着数据科学作为一门数据背后的科学,可以开设相关专业。2016年2月,北京大学、对外经济贸易大学、中南大学首次成功申请到“数据科学与大数据技术”本科新专业。截至目前,数据科学与大数据专业也仅仅发展了三年左右的时间,因此,这还是一个发展中的专业,会面临以下几方面的问题。(1)权威的专业书籍缺少。目前的很多书籍大多是技术人员编写的实战书籍,实用性很强,但是缺乏由浅及深、循序渐进且系统讲述理论的教材。(2)师资力量薄弱。课程跨学科,需要的理论基础较难较多,成为一个数据科学家还需要时间。即使现在有很多已经在企业熟练应用大数据技术的专业人员,但是缺乏将理论和实践相互结合的人才。(3)对本专业理解上的偏差。由于本专业还在不断的丰富和成长之中,即使有些学校已经开设此专业,也会由于其对专业理解上的偏差造成培养出来的学生不符合实际要求,学生在就业后仍感觉不适应工作。(4)专业面临不断的变化。要求人才培养方案能够顺应时代的发展,慢慢摸索,适应变化,培养出合格的数据科学人才,这给教师和专业负责人都带来了一定的困难和挑战。

五 结束语

数据科学与大数据技术专业是一个发展中的专业,国内很多高校也在摸索中不断完善专业的课程设置和人才培养方案,同时也在探索研究方向的分类,设置科学合理的教研室。目前,谈论大数据的人很多,但是真正理解其本质并将其作为一门科学来看待的人少,因此,简要阐述了数据科学的概念及其与大数据的关系,并提出了数据科学与大数据专业的几个研究方向,同时,给出了本科学生培养的几个阶段。目前,已有大量的教学科研工作者投入到数据科学与大数据技术专业的研究中,在不断的探索和迭代中,数据科学与大数据技术专业将会更加成熟。

参考文献

[1]三好网.2019高校新工科专业解析:数据科学与大数据技术,就业前景及开设高校[EB/OL].https://toutiao.sanhao.com/mobile/news-detail-33005.html,2019-04-02.
[2]朝乐门,邢春晓,王雨晴.数据科学与大数据技术专业特色课程研究[J].计算机科学,2018,45(03):3-10.
[3]朝乐门,杨灿军,王盛杰,等.全球数据科学课程建设现状的实证分析[J].数据分析与知识发现,2017(06):12-21.
[4]王萌,王晓荣,韦璐.数据科学与大数据技术专业建设实践与思考[J].高教论坛,2019(08):35-38+87.
[5]宋晖,刘晓强,杜明,等.大学计算机基础类数据科学课程的探索与实践[J].计算机教育,2019(09):88-91.
[6]樊迪.论高校本科开设大数据专业的重要性[J].沈阳工程学院学报(社会科学版),2018,14(01):119-123.
[7]朝乐门.数据科学[M].北京:清华大学出版社:2016:20-30.
[8]奥弗·曼德勒维奇.数据科学与大数据技术导论[M].北京机械工业出版社,2018:5-10.
[9]郎为民.漫话大数据[M].北京:人民邮电出版社,2014:35-40.
[10]朝乐门,邢春晓,张勇.数据科学研究的现状与趋势[J].计算机科学,2018,45(01):1-13.
[11]高扬.数据科学家养成手册[M].北京:电子工业出版社,2017:3-10.

关注SCI论文创作发表,寻求SCI论文修改润色、SCI论文代发表等服务支撑,请锁定SCI论文网!
文章出自SCI论文网转载请注明出处:https://www.lunwensci.com/jiaoyulunwen/31641.html

发表评论

Sci论文网 - Sci论文发表 - Sci论文修改润色 - Sci论文期刊 - Sci论文代发
Copyright © Sci论文网 版权所有 | SCI论文网手机版 | 鄂ICP备2022005580号-2 | 网站地图xml | 百度地图xml