Sci论文 - 至繁归于至简,Sci论文网。 设为首页|加入收藏
当前位置:首页 > 教育论文 > 正文

基于可视化系统的知识图谱教学模式论文

发布时间:2021-08-20 11:41:12 文章来源:SCI论文网 我要评论














SCI论文(www.lunwensci.com):
 
摘 要:知识图谱是计算机专业前沿技术之一,可用于挖掘分析数据之间的关联。但是该技术缺乏成熟的知识体系,加之学生对于该技术接触少,传统教学方法无法生动形象使学生理解掌握该技术。基于可视化系统的知识图谱教学模式,通过将理论知识与可视化系统结合,加深学生对知识图谱应用场景和应用方法的理解,进而获得较好的教学效果。

关键词:知识图谱;可视化系统;教学模式

本文引用格式:王成,胡瑞鑫 . 基于可视化系统的知识图谱教学模式 [J]. 教育现代化 ,2021,8(39):166-169.

Teaching Mode of Knowledge Graph based on Visual System

WANG Cheng, HU Ruixin
(Department of Computer Science and Technology, Tongji University, Shanghai)

Abstract: Knowledge graph is one of the cutting-edge technologies of computer science, which can be used to mine and analyze the associations between data. However, the technology lacks a mature knowledge framework, and students have little contact with the technology, traditional teaching methods cannot vividly make students understand and master the technology.    The visual teaching mode of the knowledge graph, through the combination of theoretical knowledge and the visualization system, deepens students’ understanding of the application scenarios and application methods of the knowledge graph, and then obtains a better teaching effect.

Keywords: knowledge graph; visual system; teaching mode

一 引言

知识图谱作为研究生算法课程的重要内容之一, 所涉及的技术新颖前沿。知识图谱技术可用来挖掘发现数据之间的关联,通过对数据进行处理 [1],分析得出数据集中实体之间的关系构建知识图谱。知识图谱在现实中有许多的应用场景,聚类分析 [2-4] 则是知识图谱应用场景之一。知识图谱作为前沿技术之一,现阶段该技术的知识体系较为碎片化,缺乏清晰明了的知识体系,同时学生未接触过该技术的相关知识,对知识图谱的概念和应用场景陌生。加之研究生算法课程安排,针对知识图谱的课时相对较少,因此如何在较短的时间内掌握知识图谱的基本概念和适用场景是亟待解决的问题之一,传统的教学方式枯燥无味,学生虽然听课过程会记住相应概念,但是存在理论与实践脱节的现象。

为进一步优化课程教学,使学生能够在较短的课时内建立对知识图谱的概念理解,在授课期间加以具体应用场景的可视化系统,以可视化系统为主线从数据的预处理,到知识图谱的构建,最终阐述可视化系统的搭建,使得学生对知识图谱的应用场景以及应用方法有个立体直观的认知。利用课下时间,设计相关实验提高学生的实践能力,通过实践使学生脱离以往做实验时的依赖性 [5-6],从而进一步提高培养学生将掌握的知识应用到实际场景中。可视化系统对课程带来的优异效果也在多方面得到了验证,例如将可视化系统应用于军事课程中 [7] 模拟军队运动情况,利用可视化方法应用在常微分方程 [8] 课程中教学,也有将可视化教学技术应用在临床麻醉学教学 [9] 中取得良好的教学效果。

\

二 课程内容组成

知识图谱技术涉及自然语言处理、图数据库、机器学习等各领域知识,适用于金融反欺诈、信息检索等多种场景。需要合理安排各领域知识,通过具体场景的应用实例进行教学。通过具体的应用场景带入,讲述基本的数据处理技巧、知识图谱的构建更新技巧、知识图谱的存储方式以及知识图谱的基础应用方法。通过具体案例引入知识图谱的概念, 针对该案例讲述每一步骤的处理方式,从而达到学生能够生动形象的了解知识图谱的概念和应用技巧。

针对数据处理部分,通过具体场景的数据集分析该数据集所存在的问题,可能存在的问题包括但不限于关键值为空、重复数据和特征数据选取。针对每一个问题,给出相关解决方案,也可以安排学生自主讨论问题解决方案。利用处理后的数据,构建知识图谱并将该图谱进行存储,可通过图数据库如 Neo4j 构建和存储数据, 通过实例数据将数据导入 Neo4j 中, 使学生通过具体案例掌握图数据库和关系型数据库之间的区别,同时该部分内容可以引导学生了解图数据库冷启动和热加载两种情况下的导入数据方法,讲解每种方法适用的场景。构建完成的知识图谱需要应用解决具体的场景问题,例如挖掘网络借贷欺诈申请的问题,讲述利用知识图谱结合机器学习领域的无监督聚类方法发现网络借贷场景中欺诈申请的审批。

数据处理部分是课程的基石,通过对问题数据集进行数据清洗,获得高质量的数据,课程需要在该部分讲解的内容包括但不限于以下内容:

数据处理的重要性,数据处理为算法应用的基石,若数据处理不恰当会导致算法应用时无法发挥算法的性能优势且模型调优复杂化。

常见数据问题及其对应的数据处理方法,例如数据集中空值问题可以采用平均值填充或删除等方式对数据集中空字段进行处理。

数据处理后的应用场景,介绍各领域对数据的应用方式,例如推荐算法分析数据对用户推荐,反欺诈算法利用数据构建风控平台。

知识图谱构建部分对课程内容起着承上启下的功能,通过将处理得到的数据导入图数据库构建知识图谱,并讲解知识图谱的使用场景。该部分讲解的内容包括但不限于以下的内容:

NoSQL 的种类, 图数据库在 NoSQL 中的作用, NoSQL 数据库与关系型数据库之间的区别,不同种类的 NoSQL 数据库适用场景。

Neo4j 数据库在冷启动和热加载两种场景下的数据导入方法,Cypher 语句的基础功能,Neo4j 数据库提供的扩展能力。

异质知识图谱的构建过程,以及如何对异质知识图谱挖掘有效特征信息,如何将异质知识图谱提取得出同质知识图谱。

聚类算法实现部分是该课程的重点讲授内容, 通过分析不同种类的聚类算法,分析这些聚类算法的工作原理及其使用场景,该部分讲解内容包括但不限于以下内容:

聚类算法的种类,不同种类聚类算法的工作原理和使用场景,同时介绍每种聚类算法中的代表算法及其优化方案。
如何将聚类算法应用在前述构建的知识图谱中, 根据具体的应用场景,介绍从模型选型到具体实现的思路。
介绍不同代表性聚类算法的调优方案,以及聚类算法的研究方向。

课程内容也可根据具体课时灵活安排,上述的课程内容主要针对硕士研究生的算法课程,本科生的算法课程可以简化相关内容,以课程核心基础内容为主,让本科生能够宏观理解算法的重要性,激起学生对算法学习的好奇心,引导学生自主学习其他相关算法知识,课程讲述过程中加以可视化系统作为辅助工具,方便学生理解具体算法的工作流程, 也鼓励学生自主开发相关可视化工具,将理论知识与实践相结合,提高教学质量。

\

三 可视化系统展示

可视化系统可以有效地展示知识图谱技术在具体应用场景下的工作流程,为了形象直观地向学生展示该技术的构建和应用方式,可以通过构建具体应用场景下的可视化系统,展示该场景下知识图谱的工作流程。在此以构建的应用于互联网金融反欺诈的可视化系统为例,展示授课期间涉及到的知识图谱的技术以及应用,图 1-2 展示了互联网金融反欺诈的可视化系统截图。

可视化系统基于网络借贷场景构建,目的是通过机器学习领域中聚类算法将异常借贷申请提前发现并在申请阶段拒绝借贷人申请,系统所使用的数据集为国内某银行加密脱敏后的数据集,数据集包括申请人的基本信息,例如:经过 MD5 加密的申请人申请号码,手机号等特征信息。

数据处理过程对所得数据集首先进行去重处理,将重复借贷申请数据删除,对关键特征的缺失数据进行填充,非关键特征数据则采取丢弃的方法, 同时挖掘出申请单号之间的关联信息,方便后续构建同质知识图谱的操作。构建知识图谱阶段,针对Neo4j 的冷启动添加数据,可以将挖掘出来的申请单号关联信息, 通过 Neo4j 提供的导入工具将数据导入 Neo4j 中构建一张同质的知识图谱,该知识图谱仅包括申请单号节点。针对 Neo4j 的热加载过程, 则可以通过特定计算机语言借助第三方工具导入数据。机器学习中聚类算法构建阶段,结合网络资源, 学生可自主选择聚类算法,实现将数据集中相似节点聚集在一起的操作。

\

可视化系统总共分成三个功能,图 1 左图为同质知识图谱网络,当点击新增按钮后,会根据索引号查询 Neo4j 数据库,将检索到的数据返回给前端, 若节点为正常借贷申请的节点,节点颜色标记为蓝色,否则标记为红色。根据返回的节点关联信息, 判断新增节点与已有知识图谱内节点是否关联,若存在关联关系则自动添加至对应的节点附近,并通过直线连接,直线上标记数字表示两个节点所具有的相同特征。图 1 右图表示通过聚类算法,借贷节点聚类情况,左方点击算法按钮,对已有知识图谱节点进行聚类操作,将相似节点聚集在一起,相同社区 ID 的节点距离较近,不同社区 ID 的节点则距离较远。同时左下方分别标明聚类算法每添加一个新的节点后的性能变化情况,若聚类算法对新增节点判断错误则对应的性能指标用红色标记,若判断正确则用蓝色标记。通过向学生讲解整个可视化系统的结构,明确实验具体细节,从而进一步提高学生对算法课程的理解。图 2 为节点的详细信息,可以通过双击图 1 中知识图谱中节点进入该节点的详情页,查看该节点的关键信息。该部分内容可以根据具体需要勾选对应的关键特征展示该节点信息。

\
                          
四 课程实验设计

算法设计实验往往要求学生利用具体计算机语言实现算法核心思想, 通过不同的测试用例来验证算法实现是否正确。但是这类实验效果较差,学生仅实现算法, 但是对算法的应用场景和优化流程并未熟悉。为了进一步提高学生的动手能力,以及具体应用场景的分析能力,通过设置详细的实验内容包括但不限于完成数据处理、系统搭建等流程,锻炼学生的动手实践能力,使得学生能够理解算法的设计思路和工作流程。拓展算法实验的内容,体现出实验的灵活性、个性化和综合性。

为此将基于知识图谱的可视化实验分成三种模块,分别为数据处理模块、知识图谱构建模块、聚类算法模块。整个实验系统的模块结构如图 3 所示。提供给学生的实验数据集可以为公开数据集或者经过加密脱敏处理后的真实应用场景的数据,不建议提供仿真数据。数据集应具有空值缺失、数据重复、噪声数据干扰等特征, 从而锻炼学生面对真实场景数据集的应对能力。学生根据提供的数据集,构建数据处理模块,通过利用数据分析处理工具,对空值进行填充或删除,删除重复数据以及剔除噪声数据。并将采取的方案梳理成文档,用于后续成绩判定。

选取 Neo4j 作为知识图谱构建模块的底层存储数据库,一方面可以扩展学生对不同类型数据库功能的认识,使得学生了解到图数据库和关系数据库之间的差异性,另一方面 Neo4j 提供丰富的文档资源, 可以锻炼学生实际实验过程中对文档阅读能力。学生将处理完成后的数据,通过自主编写脚本代码的方式,将数据导入到 Neo4j 图数据库中。
聚类算法设计模块,要求学生选择课程讲授的一种或多种聚类算法,实现对所提供数据集的聚类操作,学生需要通过调参等方式进一步提高算法的准确性。算法模型训练完成后,根据测试集数据来验证模型性能,并根据测试数据集所得到的模型性能决定学生的实验成绩。

\
 
课程实验内容和设计要求可参考表 1,可以将该实验设置为课程作业作为课程成绩评估参考项之一。

五 总结

基于可视化系统的知识图谱教学模式, 利用可视化系统作为引导,向学生展示了知识图谱技术如何应用以及处理的流程,进一步提高学生对算法应用和解决实际问题的能力。通过设置课程实验内容,学生从获取数据集,对数据集进行数据处理, 利用处理完成的数据构建知识图谱,自主选择实现聚类算法,实验内容几乎涉及到计算机专业课程的全部内容,从算法理论到具体实现。进而提高学生对算法课程的兴趣,以及自主学习意识,提高教学质量。

参考文献

[1]吕小锋 . 基于 Stata 编程的国际商务数据处理与分析课程教改设计 [J]. 科技创新与生产力 , 2017(8):58-60.
[2]刘洁 . 聚类分析——让我们轻松找到事物之间的联系 [J]. 北京统计 , 2003(9):45-46.
[3]范金. 上证30 指数二届成份股的聚类分析[J]. 数理统计与管理, 1998 (5):15-20.
[4]王亮红 , 宋代清 , 徐娜 . 聚类分析在学生成绩分析中的应用 [J]. 东北电力大学学报 ( 社会科学版 ),2009,29(04):35-38.
[5]朱志彪 , 高山 . 设置综合设计性实验 提高学生综合素质 [J]. 实验室研究与探索 , 2010(07):250-252.
[6]刘训东 , 杨宏伟 , 左剑恶 , 等 . 贯彻教书育人根本 探索实验教学改革 [J]. 实验室研究与探索 , 2014(8):211-214.
[7]汤慧仪《. 战场可视化》课程的知识把握与理解 [J]. 教育现代化 , 2016(15):101-102+104.
[8]周忠 , 周瑞芳 . 可视化方法在常微分方程数值解教学中的应用[J]. 教育现代化 , 2018,5(01):177-179.
[9]刘怿敏 , 谢皇 . 可视化教学技术在临床麻醉学教学中的应用研究 [J]. 教育现代化 , 2019, 6(10):194-196+200.
                               
关注SCI论文创作发表,寻求SCI论文修改润色、SCI论文代发表等服务支撑,请锁定SCI论文网!

文章出自SCI论文网转载请注明出处:https://www.lunwensci.com/jiaoyulunwen/32596.html

发表评论

Sci论文网 - Sci论文发表 - Sci论文修改润色 - Sci论文期刊 - Sci论文代发
Copyright © Sci论文网 版权所有 | SCI论文网手机版 | 鄂ICP备2022005580号-2 | 网站地图xml | 百度地图xml