Sci论文 - 至繁归于至简,Sci论文网。 设为首页|加入收藏
当前位置:首页 > 计算机论文 > 正文

数据挖掘算法在医疗管理中的应用研究论文

发布时间:2023-09-19 15:31:56 文章来源:SCI论文网 我要评论














SCI论文(www.lunwensci.com)  

  摘要:数据挖掘是从海量数据当中挖掘出有价值知识的过程,统计学、机器学习、方式辨识、数据库等学科是数据挖掘的技术来源。文章主要阐述了数据挖掘算法的相关知识,分析了完成数据挖掘的核心技术,尤其是决策树算法,并对数据挖掘在医疗管理中的运用进行了研究,希望能为管理者对医疗管理数据的深入挖掘提供一些参考。

  关键词:数据挖掘算法;医疗管理;数据库;应用

  【Abstract】:Data mining is a process of mining valuable knowledge from massive data.Statistics,machine learning,mode identification,database and other disciplines are the technical sources of data mining.This paper mainly explains the relevant knowledge of data mining algorithm,analyzes the core technology of data mining,especially the decision tree algorithm,and studies the application of data mining in medical management,hoping to provide some reference for managers to dig the medical management data.

  【Key words】:data mining algorithm;medical management;database;application

  目前,在计算机信息技术的飞速发展下,数据库规模得到了进一步的拓展,由此建立了大规模数据库。不过,在此巨大的网络信息数据仓库当中,存在着大批人们难以甄别出来的数据。如果要在此类隐性数据当中找出有价值的信息,进行数据挖掘至关重要,特别是在医疗卫生方面同样形成了海量有用的数据,对此类数据进行全面的开发及应用可以有效优化照护模式,推动人们的身体健康,降低医疗支出。

  1数据挖掘技术的含义

  数据挖掘是基于数据库、统计学、机器学等多类技术相融后的产物[1],其具有以下几个特点[2]:(1)当数据挖掘目标是庞大的数据时,人工分析在此时已无法完成,因此必须交由计算机来自主处理。因数据量巨大,算法功能也因此被提出更高要求。(2)数据挖掘旨在找出“有趣”且“不明确”的知识,此类知识的展示模式用户能够理解。此处的“有趣”一方面指此类知识是客观有价值的,也就是体现出客观的规律;另一方面也指此类知识对用户而言是主观有价值的,也就是用户想了解的。(3)以上界定中并未限定数据挖掘的模式。原因在于目前存在诸多数据挖掘方式,同时新挖掘方式也层出不穷,无法对此类挖掘方式加以限制。可有效实现挖掘目标的办法即为好办法,由此则需要基于具体诉求来选取合理或提出全新的挖掘方式。

  2主要的数据挖掘算法

  常见的数据挖掘算法有以下几种:(1)关联规则的挖掘。其目的在于找出海量数据中各项集的趣味性联系或关系,是在众多事件当中形成的各个项的相关性,如超市数据当中,消费者所得各类商品的相关性;(2)粗糙集理论。该理论是在1982年由波兰华沙理工大学Z.Pawlak教授主张的对缺失性、未知性知识及数据进行探索的一种理论体现方式,目前已经成为探索数据挖掘与知识寻找的强大手段;(3)决策树学习。此种算法是应用最为广泛的总结逻辑算法,是逼近离散值预期函数的方式之一,此类方式当中可以以一棵决策树来代表对所得函数的学习,其也可称作判定树,属于一种结构,借助对简单决策原则的运用,以此结构能把大规模记录划分成彼此相关的小记录集。本次研究中应用的数据挖掘算法就是决策树学习。

  3医疗管理数据挖掘流程

  3.1定义需求

  在此时期实施诉求分析和资源发掘,界定诉求,细化医疗任务与核心群体,知晓现阶段此需求的达成渠道。评测既有的资源,在明确出挖掘对象,建立挖掘方案,并从所得初始数据当中提取相应规模的数据子集,构筑起数据挖掘库。

  3.2数据预处理

  明确出挖掘的数据源,含有数据库内数据源或通过自主采集得来的数据库外的数据源,根据数据的属性、大小、格式来列出数据源的类别,让早期获取的数据能够回答某些数据挖掘任务,并还可以认同原始设想或是形成对于新特性的研究[3]。

  3.3数据挖掘

  通过科学的数据挖掘计算方法实现对数据的分析,此是医学类知识挖掘中的核心流程。完成对数据的挖掘方式主要有关联、聚类、趋势、孤立点、偏差等分析法,以及概念描述、分类和预估等,挖掘结果在具体的音乐中必须通过多次验证,对其的科学性加以核验,此要求和专家有一定的互动,对多项实验结果与其的医疗经验加以核实,来验证挖掘方式是否合理。

  3.4分析评估

  对所发现的知识准确性加以评估,且和初始研究任务对比,所得结果对于使用人而言不难理解。在医疗方面要求所发现的知识有无新意和实用性,能否基于医疗维度来解释结论,且与初始数据挖掘任务相符。

  3.5确定实施方案

  建模且通过验证后,可借助以下两种方式来实施方案:一种是为分析者提供借鉴,在其对此模型进行观察分析后给出有关实施计划;另一种是在各种数据集中运用此模型。

  4医疗管理数据挖掘系统设计及应用

  该系统数据是源自HIS系统当中的医疗信息,借助分析数据模型构筑起数据仓库,利用预处理、建树及剪妆数据形成指标并复返至用户界面[4]。其主要由用户界面、数据库接口、决策树生成和决策模块组成,整个结构如图1所示。

\

  4.1关键技术

  医疗数据的独特性,有必要对数据源实施预处理和信息结合,为发掘出最合理的决策管理办法,则要对结构化处理后的数据构筑关联原则,该系统主要通过决策树算法来挖掘与分析医疗数据。

  4.1.1数据预处理及融合

  医疗数据库当中有着庞大的各类初始信息源,如大批不明确、有缺失、有噪音、重复的信息。开展数据的挖掘,应预先清理并过滤此类信息,进而使数据的统一性与明确性得到保障,同时把其转化为与挖掘相匹配的方式[5]。医疗数据当有海量文本符号及数据时,对于此类具有各种物理属性的医疗数据,要选取相应手段来加以处理,让它们的属性能够趋同或者达成统一,然后整合处理结论。医疗数据多源性、时序性与非时序性的数据、数字类与非数字类的数据的并存特性,使信息更难以有效相融。

  4.1.2决策树算法

  本次研究主要选取了决策树算法来挖掘医疗数据,这种算法是通过分类概念下的算法来对树进行构建,该树会根据培训集中所剩余列来对列值预估,所以树内所有节点均表示一列的某个事件,把该节点置于什么地方决定于算法,同时在各种深度的节点或将表示每一列的各类事件。决策树通过树结构来呈现类别划分模式,而树结构内的节点则表示对数据的不断分类。

  4.2挖掘分析实例

  挖掘分析实例的挖掘与分析是通过患者的医疗支出来开展的,挖掘数据时,监测管理医疗支出数据的形成步骤与结果,明确出数据挖掘目标,对患者不同的时期、年龄段及项目方面的住院支出等情况进行研究。

  挖掘分析的实施主要分为三个时期:首先是数据准备期,也就是对患者的住院医疗支出数据进行搜集,建立基础数据库;其次是预处理期,通过患者的重要信息及医疗支出信息的处理,建立关联规则事物表;最后是通过决策树算法展开对医疗支出信息发现的数据挖掘。将医院384名患者的医疗支出信息作为分析对象,根据年龄阶段来分,20~70岁阶段的患者在医疗支出上呈递增的势态,而40~70岁阶段的患者的医疗支出在总的患者支出中占比为58.07%,若再增加性别,根据各个年龄段与性别在住院支出形成的影响,可通过如图2所示的决策树来体现,边框象征事件密度,边框的粗细与事件的多少呈正比关系。对于此类患者在西药、治疗、检查等方面的基础项目费用明细在整体费用中占比为76.71%,其是影响住院支出的核心因素,以基础项目住院费用决策树表示,决策人可利用加大管理西药、治疗、检查等费用的力度来把控医疗支出。

\

  4.3数据挖掘算法在医疗管理中的应用

  对数据挖掘技术的探索及应用在病情诊断与医院的管理当中有着十分重要的作用,系统能对临床诊疗、治疗支出和成本效益进行有效的分析与挖掘。

  4.3.1临床医疗诊断挖掘分析

  选择数据挖掘来分析患者的工作、年龄、身份、所在地及生活工作环境等特性,按照相关规则对出现几率较大的部分并发症进行挖掘,找出某些病症和人们的年龄、性别、所在地、工作生活的环境等之间的关联。对于某些常见、多发及严重传染性等疾病的临床诊疗信息展开全方位的对比,对特征空间分别采样,采用和数据挖掘任务有关的各种属性,生成数据模型,通过医务工作者对模型所生成的结果加以分析和预估,最终得到合适的执行计划[6]。

  4.3.2医疗费用挖掘分析

  医疗支出的挖掘分析主要有患者支出结构分析、同期支出比对分析、单病种住院支出分析。患者支出的结构分析是指借助对医院、科室或不同病区患者的支出结构进行分析,控制相应的支出比重,对医疗费用项目构成的科学性进行探讨,让医院高层能有指向的对医疗费用加以管控[7]。同期费用比对分析是指根据各种时间阶段(年、季度、月)针对不同的科室或病房的各类同期费用加以对比分析,同时借助各类专业报表及视图表达给医院高层。单病种住院的费用分析是按照ICD-10疾病的划分指标来实施的,涉及到对于单病种患者自身状况、病情、治疗计划及住院天数等的分析,为医疗水平的管理给出凭据,让医务人员及时整合经验,发掘出更好的医疗技术,提升医疗支出的合理性,降低病人的医疗负担,使医院获得更好的经济收益与社会效益。

  4.3.3成本效益挖掘分析

  将各类医院信息系统的数据汇聚至数据库中,切实分析医院的成本收益状况,以充分了解医院的经营现状。如不同药品库存量的时间动态走向,借助分析降低药品的库存量,加速资本周转。按所需统计出医院药品、耗材用量和主要的供应厂家,以确保存量的科学性,对医疗用品的购销活动进行良好规范。对医院的资金运作状况开展财务分析,对医院的财务情况和资金动向有所掌握,梳理医院的营运风险,通过数据挖掘环基比与定基比方法对医院的财务资金增速进行分析,且以曲线拟合对后期的现金需求量加以预估,为决策与资源的良好分配给出一定参考。

  5结语

  数据挖掘是分析数据的一个关键技术,在增强医疗大数据应用率上有着重要价值。本次研究对目前的医疗管理数据给出了一种在医疗管理当中运用数据挖掘算法的设计。不难看出,该算法的数据处理成效较高,并能更进一步地对数据内容进行挖掘,有着极高的实践意义。

  参考文献

  [1]SHAN J W,KAMBER M,PEI J.数据挖掘:概念与技术[M].范明,孟小峰,译.北京:机械工业出版社,2007.

  [2]David Hand,Heikki Mannila,Padhraic Smyth.数据挖掘原理[M].张银奎,廖丽,宋俊,等译.北京:机械工业出版社,2003.[3]谢彬.数据挖掘与分析在医疗业务中的应用[J].电子技术与软件工程,2021(15):181-182.

  [4]黄晞.基于数据挖掘的医疗信息管理系统设计[J].微型电脑应用,2021(3):35-38.

  [5]郑秀娟.数据挖掘技术在医疗大数据中的应用研究[J].电脑知识与技术,2020(32):26-27+35.

  [6]于国庆,沈飞.数据挖掘技术在医疗大数据分析中的应用—评《医疗大数据分析与数据挖掘处理研究》[J].中国科技论文,2022(7):847.

  [7]郑经纬.基于数据挖掘的医疗分析系统研究[D].杭州:杭州电子科技大学,2022.


文章出自SCI论文网转载请注明出处:https://www.lunwensci.com/jisuanjilunwen/63333.html

发表评论

Sci论文网 - Sci论文发表 - Sci论文修改润色 - Sci论文期刊 - Sci论文代发
Copyright © Sci论文网 版权所有 | SCI论文网手机版 | 鄂ICP备2022005580号-2 | 网站地图xml | 百度地图xml