SCI论文(www.lunwensci.com):
摘要:计算机软件工程的全面发展,需要注重数据技术的使用,在软件系统数据规模不断扩大的背景下,有效提取和应用有价值、有针对性的数据,成为数据挖掘技术实践的重要目标。文章通过对数据挖掘技术进行实践分析,旨在为计算机软件工程进步发展提供助力和借鉴,使软件工程开发实践水平提升。
关键词:计算机;软件工程;数据挖掘技术;数据提取分析
Practical Analysis of Data Mining Technology Based on Computer Software Engineering
JING Wenying
(Qingdao University,Qingdao Shandong 266071)
【Abstract】:The all-round development of computer software engineering needs to pay attention to the use of data technology.Under the background of the continuous expansion of the data scale of software system,effectively extracting and applying valuable and targeted data has become an important goal of data mining technology practice.Through the practical analysis of data mining technology,this paper aims to provide power and reference for the progress and development of computer software engineering,and improve the practical level of software engineering development.
【Key words】:computer;software engineering;data mining technology;data extraction and analysis
基于计算机软件工程应用层面,对数据挖掘技术进行全面、深入的研究,是现代软件工程领域发展的重要趋势。数据挖掘技术优势非常明显,在不同的挖掘方法支持下,可以确保软件工程开发和实践中,对各种数据的科学有效掌握。通过源代码开发、软件管理信息、程序代码以及软件故障检测中的数据挖掘技术应用,可以进行高效的软件数据管理。
1数据挖掘技术
随着大数据时代的到来,在计算机软件工程中,通过数据挖掘技术获得更大的数据价值,已经成为软件工程开发人员的重要工作目标。数据挖掘技术,是通过软件工程中的程序编辑和模型建立,对大量信息数据进行分析和提取,找到符合运行目标的数据。数据挖掘技术的实施,具有较强的流程性和规则性。数据挖掘的对象目标,往往是整个数据库的数据,在数据库建立时,就要考虑到数据挖掘的需要,从数据格式、数据分类等方面做好铺垫。数据挖掘过程按照既定步骤,首先进行数据的探查,数据探查是对数据的信息的全面掌握,包括数据源、数据链接、数据格式等,在数据探查中可以对数据进行必要的统计分类,这样可以为后续的提取和挖掘做好准备[1]。其次进行数据提取,数据提取必须有相应的信息标准,也就是计算机程序必须明确,提取的数据必须具备哪些信息特征,这样可以确保数据提取的针对性和有效性。最后是数据模型建立,数据模型是根据计算机软件工程要求,根据数据规律的掌握和挖掘目标情况,在具体数据中找到一个统一的框架,这个框架就是一种数据模型,当模型建立后,只需要更换具体数据,就可以自动快速地获得相关结果,使软件工程可以完成既定的任务目标。
数据挖掘技术,根据技术原理和特点,可以进一步细分为关联技术、分类技术和聚合技术。数据挖掘中的关联技术,是通过对数据特征的归纳,将存在关联关系的数据进行同步处理。关联数据由于存在了联系性,在数据属性方面具有显著的共同点,这些共同点表现在数据挖掘实践中,可以归纳为数据支持的关联、数据置信的关联等,从而保证数据挖掘匹配程度较高,可以实现批量处理和规模处理目的。分类技术,则是基于数据模型建立的原则上,根据计算机程序编辑一个数据范围,该数据范围可以对数据定性,并对应数据挖掘计算准则,确保数据分类准确和科学。数据分类的重要基础,是对数据进行判断,这个判断过程可以通过树形结构程序,分步骤或者按照网络模式注意判断,最终得到符合分类标准的数据。聚类技术则是以数据簇为挖掘形式,按照软件工程的相关参数,设定数据同质性规则,以此为识别方法,明确数据挖掘和提取的规则,从而增强数据归纳的准确性。
2计算机软件工程中的数据挖掘技术应用
2.1源代码开发中的数据挖掘应用
计算机软件工程中,需要基于软件开发目标和要求,做好数据挖掘工作。软件开发是基于源代码编辑实现的,软件工程人员需要根据需要,分解开发项目,并通过对软件应用范围、标准和执行路径等的理解和掌握,在源代码开发中利用数据挖掘,提高软件开发能力。软件开发过程中,由于各种源代码来源非常广泛,在利用这种源代码重新构建新的软件模块时,需要依据开发对象的特征,找到数据挖掘的标准和原则[2]。数据挖掘技术应用中,利用不同的数据挖掘方法,可以构建一个专门用于源代码分析、提取和建模的数据系统。该数据系统可以完成规模性的开发任务。如软件工程开发中,存在一个软件系统多项具体应用功能时,数据挖掘技术就可以显示较强的应用价值。在数据挖掘时,基于源代码的功能、目标等分类,可以提取出符合开发对象需要的一系列数据,这些数据可以重新构成一个数据库,以供软件开发人员进行借鉴与使用。
2.2软件管理信息中的数据挖掘应用
2.2.1项目组织信息数据挖掘
软件工程实践中,由于软件项目管理信息数量多,并且信息复杂程度高,为了保证项目开发工作的顺利实施,可以利用数据挖掘技术,将组织信息予以统筹规范,提高信息流传和使用效率。软件开发项目中,最重要的组织信息就是人员信息,在执行具体的软件开发任务时,由于需要开发人员相互配合,并且及时有效地进行开发进程等信息、数据的交互,因此要充分依靠数据挖掘技术,在大量信息中实现提取和分析。软件工程开发过程中,每个开发人员承担的是一部分工作内容,如编辑某个环节和场景的程序模块等,这些工作最终要进行整合,才能够实现开发目标[3]。通过数据挖掘技术,让每个开发人员可以根据具体工作情况,在项目管理涉及到的电子邮件、电子文档和表格等数据中,快速准确选择与工作有关的信息,避免出现开发过程无序或者效率低下的问题。
2.2.2项目版本信息数据挖掘
软件工程发展中,需要考虑到软件后续维护方面的需要。利用数据挖掘技术,可以对软件项目版本信息更好地掌握,从而增强维护能力。对于软件而言,随着功能的完善和漏洞弥补等,对软件会进行必要的更新和修复,这个过程必然会涉及到版本信息的变化。数据挖掘技术运用于版本管理方面,可以在计算机软件系统安装和更新时,快速准确查找到版本的一系列信息情况,包括版本号、版本更新时间和更新内容,以及版本修复记录等。数据挖掘技术,将这些挖掘到的软件信息予以归类和呈现,可以让软件开发和使用者,对软件系统有更全面地掌握,从而在具体工作中可以规避一些异常使用情况。
2.3程序代码中的数据挖掘应用
2.3.1克隆程序代码
软件工程实践中,通过数据挖掘技术可以进行程序代码克隆。由于一个软件系统使用的程序代码数量是极其大的,如果这些程序代码都有软件人员进行录入,无疑会占据大量的时间和精力。由于很多软件程序都有一定的规则,也就是在实现软件编程目标时,程序语言内容、逻辑等都是类似甚至是相同的,因此可以基于程序代码克隆思路,充分运用数据挖掘技术,将这些程序代码进行复制。复制程序代码有效地节约了软件工程人员的时间和精力,但是复制对象是否符合软件工程实践要求,就依赖数据挖掘技术的应用水平。在数据挖掘前,对程序代码要进行了解,将这些代码的属性、特征和标准等进行提取,基于数据挖掘构建一个克隆系统。该克隆系统基于数据挖掘功能,对大量的程序代码进行扫描,将符合挖掘特征的程序提取出来进行复制和粘贴,从而实现程序代码“搬运”。目前,克隆程序代码的准确性要求不断提高,数据挖掘技术实施中,要注意各种数据检测流程和标准的强化,如在原有挖掘基础上,增加数据识别标志或者程序语言索引等,可以提高数据挖掘效果,尤其是保证了克隆程序代码的正确性,这些程序代码复制后,软件工程人员不必花太多的精力进行纠正。
2.3.2文本分析挖掘
计算机程序代码,以文本形式呈现时,可以通过文本分析来实现数据挖掘。在文本数据挖掘过程中,需要建立明确的关注点,关注点可以作为程序代码的重要标记,通过对文本代码内容进行检测分析,可以确定数据挖掘对象。文本关注点是数据挖掘的基础,软件工程人员需要掌握文本的代码语言结构、类型等特征。数据分析对于数据挖掘是十分关键的,在挖掘程序代码时,考虑到代码文本的差异,可以采用不同的数据挖掘技术。如代码文本内容具备耦合性时,可以使用聚类技术,这种技术可以充分利用文本数据之间存在的关系,为数据分析和提取提供支持。
2.3.3代码构件挖掘
程序代码数据挖掘时,可以实现代码构件的提取和掌握。代码构件是一种对程序代码的结构检索模式,由于计算机程序编辑中,程序代码主要为字符格式,代码构件就是基于这个特点,建立代码关键词检索功能。代码检索对于数据挖掘具有相关性,在数据挖掘技术应用中,能够基于检索到的代码关键字,了解到具体代码程序的编辑逻辑结构,使用的计算机程序语言,以及软件工程师对代码的描述等,这些挖掘到的数据具有内在相关性,也就是都与检索关键字有一定联系。根据这样的数据挖掘规则和方法,软件工程领域开发出了诸如百度、谷歌检索网站,用户能够在仅仅掌握一些关键字,或者对检索目标有一定了解的情况下,通过数据挖掘获取更多相关软件内容。
2.4软件故障检测中的数据挖掘应用
2.4.1数据逆向建模
软件工程发展中,一个非常重要的环节,就是能够有效识别和处理软件故障。因此,通过计算机程序进行软件故障检测,成为软件工程的重要工作。软件故障检测中,可以发挥数据挖掘技术的优势,通过对软件系统和执行程序数据的挖掘,实现故障鉴别和分析,为故障处理和修复提供支持。软件故障检测中的数据挖掘技术实施,主要以数据逆向建模为主。数据逆向建模,与传统的计算机建模逻辑思路是相反的。传统的建模是基于软件程序数据,通过逻辑关系建立,最终得到建模结果。而在逆向建模实践中,要以软件故障为对象,通过数据挖掘技术,对故障进行全面分析,从数据程序的角度,找到故障根源并予以修复。软件系统是由大量的数据程序构成,软件故障的根源也必然是程序逻辑、程序内容等出现问题造成。逆向建模时,就是利用这个因素,对故障程序予以数据分析、挖掘。数据逆向建模,根据建模思路的不同,可以细化为对规则逆向和对执行逆向。规则逆向,是由于很多软件故障是由于软件编程中,程序人员在理解和运用相关规则时,出现了疏漏和差错,导致规则与程序不能有效匹配,无法实现软件运行目标。规则逆向就是根据存在错误的程序结果,倒推相关规则,并通过数据挖掘和对比,找到目标规则和实际规则之间的不同,从而确定软件故障所在。
2.4.2数据程序切片
随着软件工程领域的快速发展,软件工程规模更大,程序语言更多,给软件故障检测带来一定的困难。在数据挖掘技术实践中,可以针对软件故障程序,进行数据程序切片,将复杂的数据程序,分解为多个独立的程序单元,这样可以将故障更好地呈现出来。数据程序切片,是利用数据挖掘技术,对软件故障程序进行综合分析和分类。诸如采用关联挖掘技术,根据科学合理的数据关联原则,对程序进行切片,这样的程序切片可以保证软件程序在功能、逻辑等方面保持一定的完整性,不会将一个独立运行的程序分割为无法获知详细编辑目标和执行过程的碎片程序。数据程序切片采用的挖掘技术,要进行程序故障的定位,也就是故障程序应当包括在数据切片中,即便是故障程序处于不同切片,也可以基于数据挖掘技术,对故障程序运行情况,构建数据轨迹,这些数据轨迹也是数据挖掘的一部分,由此进行程序校对和检测,可以有效提升程序故障检测水平。如果一个数据程序切片检测完成后,可以依据数据挖掘的规则,将相关数据程序切片进行定位,这样能够较为全面地兼顾到程序故障的影响范围,强化程序故障检测质量。
3结语
计算机软件工程发展,需要从数据角度进行强化和完善。在软件工程实践中,充分发挥数据挖掘技术的优势,能够增强软件人员对数据的掌握。数据挖掘是针对软件系统数据对象,通过计算机技术予以分析、提取和应用,让数据价值得到最大程度地实现。计算机软件工程中,应用数据挖掘技术的具体环节较多,软件人员要结合数据技术的特点,完成对软件项目的理解,从而对软件开发和管理都形成积极的支持作用。
参考文献
[1]刘知云.关于数据挖掘技术在软件工程中的应用分析[J].电脑知识与技术,2021,17(24):27-28.
[2]白棚舟.试论数据挖掘技术在软件工程中的应用综述[J].数码设计(上),2020,9(4):3-4.
[3]张欲丰,储小勤.探析数据挖掘技术在软件工程中的应用[J].信息记录材料,2020,21(3):189-190.
关注SCI论文创作发表,寻求SCI论文修改润色、SCI论文代发表等服务支撑,请锁定SCI论文网!
文章出自SCI论文网转载请注明出处:https://www.lunwensci.com/jisuanjilunwen/46104.html