Sci论文 - 至繁归于至简,Sci论文网。 设为首页|加入收藏
当前位置:首页 > 教育论文 > 正文

基于大数据的大学生校园网使用分析 ——以S大学为例论文

发布时间:2021-08-12 14:23:26 文章来源:SCI论文网 我要评论














SCI论文(www.lunwensci.com):

摘 要:通过对高校学生的上网大数据进行描述统计和聚类分析,并对访问次数最多的 15 个域名进行分析研究,试图找出大学生上网的一些特点或者规律,以更好地了解学生的上网行为,并为以后制定合理、有效的校园网络管理策略提供决策支持。

研究表明:校园网的使用人数随着年级的升高是在减少的;不同性别和年级的学生在上网时长、上下行流量方面存在不同倾向;选择不同计费方式的学生在上网时长的控制上都倾向于利益最大化;观看视频、搜索信息和社会交流已成为学生上网的主要目的,同时云盘作为一种新兴的互联网存储方式也很受大家青睐。

关键词:大学生;校园网;描述统计;聚类分析;域名分析

本文引用格式: 杨帆 , 张佳伟 . 基于大数据的大学生校园网使用分析——以 S 大学为例 [J]. 教育现代化 ,2020,7(92):182-185,191.

Analysis on the Use of Campus Network for College students based on big Data——Taking s University as an exampleYANG Fan1,ZHANG Jiawei2(1. School of Education, Soochow University, Suzhou Jiangsu; 2. Normal College of Soochow University, Suzhou Jiangsu)

Abstract: Through the analysis of the big data of students’ online records and the 15 domains with the most visits ,this paper attempts to find out some characteristics or rules of College Students’ online behavior, so that can help making more reasonable and  effective campus network management strategies in the future.

The research indicates,that the number ofcampus network users is decreasing with the increase of grade,that students of different genders and grades have differenttendencies in the online time and up and down flow,and that the students choosing different charging methods all tend to maximize their interests in the control of online time. At the same time, Watching videos, searching information and social communication have become the main purpose of students’ online access, and cloud disk as a new way of internet storage is very popular.

Key words: college students; campus network; descriptive statistics; cluster analysis; domain analysis

一 引言

网络已成为现代人们生活不可或缺的一部分, 对于大学生来说更是如此,了解时事新闻、收发电子邮件、查阅文献、交友聊天、玩游戏等都离不开网络。校园网是学校建设的用于师生教学科研和学习生活的网络,在师生的学习生活中扮演着重要的角色。

近些年来,校园网发展迅速,各大高校校园网的建设也逐渐完善。然而随着移动信息系统的发展,从 3G(第三代移动通信网络) 到 4G(第四代移动通信网络), 再到现在正在如火如荼建设的 5G( 第五代移动通信网络), 移动网络通信的速度越来越快。同时各大运营商(移动、电信、联通)逐步入驻校园,推出了各式各样的移动流量套餐,校园网用户大量流失。如果能在现有上网数据的基础上,对学生的网络使用情况
进行分析,更加深入地了解学生的上网需求及倾向,则能为以后制定更加合理的校园网络管理策略提供依据,从而给学生带来更好的用户体验。

二 文献综述

校园网的相关研究可追溯至二十世纪七十年代,早期的文献几乎都是外文文献,到了二十世纪九十年代,校园网相关的中文文献开始如雨后春笋般出现。早期文献主要集中在校园网的建设方面 [1],随着大数据的兴起,对于用户行为的研究逐渐成为热点,例如 Jessica 等人通过对校园网日志的研究发现用户属性对其上网行为有重要影响,比如专业对用户在线时间的影响较大,同时越来越多的用户选择了统一的收费方案而不是分层的收费方案,而选择了分层收费方案的用户, 在实际使用时往往会超出原先选择的流量上限 [2]。郭玉彬等人通过对学生的上网时长进行分析,得到各类学生的上网时间特征,以期为学生管理及课程时间安排提供参考 [3]。陈炜通过 Spark 平台对用户进行分类 , 并结合教务部的学生成绩 , 来判断该用户是否过于依赖网络,从而可以尽早发现学生是否过度依赖网络并进行干预 [4]。邓甜甜等人分析发现,大学生上网时间约为 6.4 小时 / 天时最为合理;当平均上网时长达 8.6 小时 / 天及以上或玩游戏的时间占上网时长的 60% 及以上时 , 都将影响学习 [5]。以往学者的研究侧重在大学生上网与学习的关系层面,而较少从提升校园网服务, 给学生用户更好的网络体验角度出发进行的研究。本文将以 S 大学为例,结合上网日志和流量数据对大学生校园网使用情况的大数据进行分析,以期给新时代新背景下的校园网的建设和完善提供参考。

三 数据采集与处理

(一) 采集数据
从 S 大学计费认证系统和流量出口系统分别统计出学生近期的上网日志和近一个月访问次数最多的 15 个域名及其流量情况。共获取到 26232 名学生的上网数据,其中包含学号,性别,上网时长,上行流量和下行流量等信息。同时将每位学生的上网数据除以天数,得到每位学生平均每天的上网时长,上行流量和下行流量。

(二) 添加年级变量
S 大学学生的上网账号为学号,学号的编制规则为“入学年份 + 专业编号 + 序号”。以 2019年入学的学生为例,本科生“入学年份”表示为“19”,研究生“入学年份”则表示为“2019”,其他年份以此类推。因此可按学号对学生的年级进行区分,将以“19”开头的学号标记为“大一”, “18”开头的学号标记为“大二”,“17”开头的学号标记为“大三”,“16”开头的学号标记为“大四”; “2019”开头的学号可标记为“研一”,“2018”开头的学号标记为“研二”,“2017”开头的学号标 记为“研三”。

四 数据分析与研究

(一) 校园网使用人数分析
对本科和研究生阶段每个年级校园网使用人数分别进行统计,绘制出图 1 各年级校园网使用人数情况,由图 1 可知本科及研究生阶段,随着年级的升高,使用校园网的人数呈现逐年下降的趋势。对本科和研究生阶段使用校园网的人数分别作线性回归分析,结果如下:
得: y1=-697.3x1+6777.5 (1) y2=-697.5x2+3426.7 (2)式(1)为本科阶段使用校园网的人数的线性
回归方程,R12 为 0.9183;式 (2) 为研究生阶段使用校园网的人数的线性回归方程,R22 为 0.9961。两条线性方程的 R2 都接近于 1,说明拟合程度都非常高,同时可以发现本科以及研究生阶段线性回归方程的斜率基本一致,这说明本科和研究生各阶段使用校园网人数呈现几乎一致的下降率。

\

 
参照 S 大学往年招生简章发现本科生和研究生阶段每年的招生人数并没有太大波动,而本科一年级至四年级和研究生一年级至三年级的校园网使用人数却呈下降趋势,这说明随着年级的升高,每年确实是有一部分校园网用户在流失的。学生刚进学校时,大多都是使用的校园网,但随着对校园环境的熟悉,了解到的上网途径更多, 选择也更多。刘波等人研究发现无线网络和移动设备越来越流行 , 移动网络设备数量追上甚至超过了传统网络设备 [6],而运营商能同时提供无线网和手机流量的服务,并且在网络带宽、网络稳定性、网络售后服务以及技术支持等方面更具优势,同时还时不时推出“充话费送上网时长”、“流量不限量”等活动,在这些因素的影响下,学生会慢慢地倾向于选择市场化程度更高的三大运营商的网络,这无疑会对校园网用户数量产生一定的影响。

(二) 不同性别和不同年级学生上网情况的描述性统计
对不同性别和不同年级的学生的上网情况分别从上网时长、上行流量和下行流量方面进行描述性统计,分别绘制出图 2 和图 3。

\
 
由图 2 可知:1. 男生平均每天比女生多上网1.32 个小时;2. 不论男生或女生,下行流量都远大于上行流量,这说明从网络上下载的字节数远大于上传的字节数;3. 男生的上网时长约为女生的 1.3 倍,而男生的上行流量是女生的 2.7 倍,下行流量是女生的 1.8 倍,这说明与女生相比较, 男生在上网过程中更多时间用来进行了一些流量消耗比较大的上网行为,比如看视频、玩游戏等。

\
由图 3 可知:1. 大一与大二、大三与大四、研一、研二与研三的上网时长的连线几乎水平, 而大二与大三,大四与研一的连线则出现较大的斜率。这说明,大一与大二学生的上网时长接近, 为 3 小时左右;大三与大四学生的上网时长接近,为 5 小时左右;研一、研二和研三学生的上网时长也接近,为 9 小时左右。大一大二阶段课程安排比较紧密,自主安排的时间相对较少,大三大四阶段课程较少,自主安排的时间相对较多,而研究生阶段课程安排更少,更多的是自己网上查阅文献、写论文之类,因此研究生上网时间远长于大三和大四的学生,大三和大四的学生上网时间又明显长于大一和大二的学生。

2. 对比本科至研究生阶段上网时长和上下行流量的变化曲线(大四与研一的连线)的斜率可以发现,上网时长的变化斜率远大于上下行流量的变化斜率,这说明研究生较本科而言,上网时间虽然增加了,但并没有增加相等倍数的流量,他们在上网过程中更少地进行了一些流量消耗较大的行为。

(三) 上网时长的聚类分析
聚类分析是将数据分为若干个类,并且使同一个类的数据尽可能相似,不同类的数据尽可能相异 [7]。K-means 聚类法是聚类分析的一种方式, 适用于对大数据的聚类分析 [8]。S 大学校园网的计费方式有两种,一种为按时收费,每小时 0.2 元,另一种为包月收费,每月 15 元不限时,因此确定需要聚类的数据为 2 类。使用 SPSS 对所有学生平均每月的上网时长进行 K-means 聚类,设置最大迭代次数为 100 次,收敛性标准为 0,分析结果显示迭代到第 28 次时达到收敛标准,聚类结果如表1 所示:

\

 
第一类学生上网时长的聚类中心为 69.9小时,第二类学生上网时长的聚类中心为 554.61 小时。根据两种计费方式可知,每月上网时长 75 小时(15 元 /0.2 元每小时)为一个临界点,如果短于 75 小时,按时收费的费用会小于包月的费用,如果长于 75 小时,按时收费的费用则会大于包月的费用。由第一类聚类中心为 69.9 个小时可以认为选择按时收费的学生,潜意识里会避免自己的上网时长超过 75 小时,否则自己选择计时收费便没有意义;由第二类聚类中心为 554.61 小时可以认为选择了包月收费的学生,在上网时间上则更随意,有可能登录后并不主动退出登录,因为不论上网时间长短,产生的费用都是相同的。

(四) 上网内容分析
通过 S 大学流量出口系统统计出了近一个月访问次数最多的 15 个域名及其流量情况,见表 2。

\

 
这其中有三个视频类域名(哔哩哔哩、爱奇艺、斗鱼),两个聊天类域名(QQ、微信),两个搜索类域名(百度、搜狗),两个云盘类域名(百度云盘、微云),一个办公类域名(WPS),一个下载类域名(迅雷)。由此可见学生对于网络的使用越来越多元化,不再局限于某一项活动和功能。[9] 观看视频、社会交流和搜索信息已成为学生上网的主要目的,同时具有安全稳定、海量存储等特点的云盘作为一种新兴的互联网存储工具也非常受学生的青睐,它的流行是大数据时代发展的一个必然趋势。


五 结论

通过对大学生校园网使用人数的分析发现, 随着年级的升高,校园网的使用人数是在减少的, 揭示了当今校园网用户流失的现状。研究发现不同性别和年级的学生在网络使用上存在较大差异, 同时从所选计费方式不同的角度对上网时长进行聚类分析,发现计费方式对学生的上网时长是有影响的,人们会倾向于利益最大化。

基于此,可以考虑参考电费的收费模式,实行统一的分时段梯队收费方式,上网高峰时每小时的单价更高, 低峰时单价更低。一方面可以免去学生需要提前开通计费方式的繁琐步骤,另一方面可以引导学生合理安排自己的上网时间,错峰上网,同时缓解校园网高峰时带宽拥堵的压力。

结合访问次数最多的 15 个域名对学生的上网内容进行分析发现,大学生对网络的使用越来越多样化,获取视频信息已成为大学生上网行为的主要目的之一, 而一个良好的视频观看体验离不开强大的网络的支撑。现有的网络建设是基于以往的技术和需求进行规划建设的,而科学技术在不断进步,社会在不断发展,学生对于网络的要求越来越高,校园网只有紧跟时代的脚步,不断加强自身建设,才能满足学生的需要,给学生带来更好地用户体验。

参考文献
[1]贺 文 华 . 校 园 网 络 的 规 划 与 设 计 [J]. 中 国 电 化 教育 ,1999(06):64-65.
[2]Wang J H, An C Q, Yang J H. A study of traffic, user behavior and pricing policies in a large campus network [J]. Computer Communications, 2011,34(16).
[3]郭玉彬 , 吴宇航 , 薄傲峰 , 等 . 基于认证数据的学生上网时间特征分析 [J]. 计算机应用与软件 , 2019, 36(11): 101-106, 133.
[4]陈炜 . 基于大数据技术的用户行为分析系统的研究 [D]. 西安 : 西安科技大学 , 2018.
[5]邓甜甜 , 熊荫乔 , 刘建娥 . 基于计费系统的校园网用户行为分析 [J]. 长沙大学学报 , 2014, 28(2): 116-119.
[6]刘波 , 宋金宝 . 基于 DHCP 服务的校园网用户特征分析 [J]. 中国传媒大学学报 ( 自然科学版 ),2017,24(05):1-6.
[7]Chen M, Han J, Yu P S. Data mining: An overview from a database perspective[J].IEEE Trans on Knowledge and Data Engineering,1996,8( 6) : 866-883.
[8]张文彤 , 董伟 . SPSS 统计分析高级教程 [M]. 第 3 版 . 北京 : 高等教育出版社 , 2018: 319-320.
[9]朱锋 . 高职院校师生上网行为分析——以长江职业学院校园网网络为例 [J]. 湖北成人教育学院学报 ,2017,23(02):75-77.

关注SCI论文创作发表,寻求SCI论文修改润色、SCI论文代发表等服务支撑,请锁定SCI论文网!

文章出自SCI论文网转载请注明出处:https://www.lunwensci.com/jiaoyulunwen/32290.html

发表评论

Sci论文网 - Sci论文发表 - Sci论文修改润色 - Sci论文期刊 - Sci论文代发
Copyright © Sci论文网 版权所有 | SCI论文网手机版 | 鄂ICP备2022005580号-2 | 网站地图xml | 百度地图xml