SCI论文(www.lunwensci.com)
摘要:软件开发是计算机相关专业的主要职业岗位,对学生的逻辑思维能力,团队协作能力、软件开发工具使用能力都有一定的要求。数据挖掘技术在软件开发中的应用对提高软件开发人员的开发能力、提高软件开发效率、提升软件开发质量等方面都起到重要作用。本论文主要从数据挖掘方法及其应用价值、软件开发中面临的问题点、数据挖掘技术在软件开发中的应用等方面进行了阐述,希望为研究开发的专家和学者提供理论参考依据。
关键词:数据挖掘技术;软件开发;应用研究
Research on Application of Data Mining Technology in Software Development
YANG Wei
(Xiantao Vocational College,Xiantao Hubei 433000)
【Abstract】:Software development is the main professional position of computer-related majors,which requires students'logical thinking ability,team cooperation ability and software development tool use ability.The application of data mining technology in software development plays an important role in improving the development ability,efficiency and quality of software developers.This paper mainly expounds the application of data mining technology in software development from data mining method and its application value,problems faced in software development,application of data mining technology in software development,and application examples of data mining technology in software development,hoping to provide theoretical reference for experts and scholars in research and development.
【Key words】:data mining technology;software development;application research
0引言
近年来,计算机系统及相关技术已经深度渗透到人们生活、社会生产体系中,软件系统则是计算机多元功能实现的重要载体,计算机软件的程序设定、功能属性、组成架构等可满足计算机行业的发展诉求。软件开发期间,传统开发模式面对大体量的数据信息呈现局限问题,容易造成开发数据与软件实际运行不匹配的问题,浪费资源。数据挖掘技术在软件开发中的应用及实现则是借助数据挖掘功能、精密算法等,辅助设计人员理清软件开发过程中的问题点,此类数据信息检索误差相对较低,且可应对大体量的数据计算,提升前期软件各项程序设计的精准性。
1数据挖掘方法及其应用价值
1.1数据挖掘方法
数据挖掘在软件开发过程中的应用,针对不同数据点界定系统执行某项指令过程中可能达到的驱动效果,结合数据挖掘技术,在不同运行环节之中进行数据分析,最终通过数据信息的表述状态界定操作模式下的数据连接形式,最终辅助软件开发对内部工序点进行逻辑化调整。当前,数据挖掘技术集中常见的方法如下。
1.1.1数据清洗
系统中的数据信息决定数据模型预测的上界,模型则是在可规范的空间内尽可能达到上界的临界值。
(1)缺失值处理:删除—缺失数据占比过高,不处理—针对类似XGBoost等树模型差值补全—统计量、高位映射、建模预测、多重插补。
(2)异常值处理:通过箱线图分析删除异常值,长尾截断。
(3)数据分桶:等频分桶、等距分桶、Best KS分桶、卡方分桶。
(4)特征标准化:标准化、归一化、幂律分布处理。
1.1.2特征功能
智能学习中的一部分,将原始数据转变为模型的训练数据的过程,增强数据信息表述的精确性。
(1)特征构造:统计量特征、时间特征、空间特征,非线性变化、特征组合。
(2)特征选择:过滤式、包裹式、嵌入式。
(3)降维:PCA、LDA、LCA。
1.1.3模型参数调节
结合模型表述出来的复杂程度,分析在标准化界定过程中的数据值,保证调节后的变量是符合前期设定标准的。
(1)线性回归模型:线性回归对特征的要求、处理长尾分布、理解线性回归模型。
(2)模型性能验证:函数、方法、实现。
(3)嵌入式特征选择:Lasso回归、Ridge回归、决策树。
(4)模型对比:常用线性模型、常用非线性模型。
(5)模型调参:贪心调参法、网格调参法、贝叶斯调参法。
1.2数据挖掘技术的应用价值
数据挖掘技术在实际应用过程中,可以看成是以数据信息为基础,在繁琐的系统空间内,按照用户指令、系统驱动指标等,挖掘具有一定价值的数据信息。与此同时,数据挖掘技术在筛选过程中,可结合算法驱动,在不同应用场景下进行分类处理,且内部数据模型在处理过程中,也不再局限特定的模型框架中,其可伴随软件开发过程中的诉求点进行动态处理。此外,数据挖掘功能可借助神经网络算法,对软件开发中的信息进行逐一检索,为软件开发人员提供更为全面的数据决策,增强数据分析功能[1]。
2软件开发中面临的问题点
2.1大体量数据造成的干预问题
软件开发期间,需先进行市场调研分析,了解软件设计、实际应用期间是否能够达到前期预设需求,然后在特定的数据组成下,逐一罗列信息点之间的逻辑关系。但是软件开发环境中,将面临大量的结构化、非结构化数据,信息表述期间如果存在误差问题,将导致系统本身存在计算或归类失误的问题[2]。例如,结构化数据中文件信息存在纰漏、非结构化数据中的代码信息存在缺陷。此外,软件开发中不同程序的设定需按照相对应的算法,且算法必须结合实际开发环境进行处理,如果软件处理过程中消耗大量数据资源,极易导致因计算资源不平均产生的数据不对称问题。
2.2软件开发期间分析方法的干预问题
软件开发具有繁琐性特点,在数据处理过程中,需综合考量软件基础设计、软件开发与软件管理之间的关系,按照软件功能点设定相对应的程序规范,保证数据信息的界定与落实可全程支撑软件系统的运行。但是受限于开发环境的繁琐性,针对某类技术点、环节点进行处理时,极易产生数据处理冗余的问题,且新型分析方法与传统分析方法在部分使用方面存在局限问题,容易产生分析误差的现象[3]。
2.3软件开发评价标准的干预问题
数据挖掘技术在实际应用过程中,是按照技术点作为软件环境开发、程序开发的基础所在,技术应用及其功能实现需具备一致性,此过程中则需要更为严谨的评测标准分析方法,增强软件开发与基础程序设定之间的对接性。但是数据挖掘技术在实际应用过程中,数据多维度的处理模式在具体表述期间,无法全面契合于软件系统的运行需求中,进而产生指标对接误差的现象[4]。产生此类问题的主要原因是由于软件开发过程中仍然采用传统的评测形式,造成评测指标与目前技术应用基准无法达成一致,后期发展中应进一步拓展评价指标的应用范畴。
3数据挖掘技术在软件开发中的应用
3.1软件研发
软件研发需综合考量到软件程序设计、开发环境、应用场景之间的链接形式,并按照具体工作流程,分析不同应用场景下的数据点,做到软件开发环境与用户诉求的精准对接,增强软件产品开发的可行性。从技术实现角度来讲,软件研发工程相对繁琐,且在技术应用范畴下,需预留拓展窗口,为后续程序的更新提供切入点,这也使得在繁琐操作流程中,数据信息之间具有预留性特点。期间,数据挖掘技术的应用,则可在数据采集环节、数据处理环节、数据存储环节等提供支撑点,按照不同功能属性,分析系统罗列与归纳数据信息的具体类别[5]。如此一来,数据信息的组内划分形式,可满足软件研发的多节点应用需求。此外,当前开源软件在市场中的占用率逐渐提升,考虑到软件的共享性、兼容性与管理性,软件在实际开发过程中也应兼具动态、开放的特点,确保数据信息的表述能力是符合软件开发与管理诉求的。
3.2项目管理
利用数据挖掘技术对软件项目进行管理,是利用内部数据信息的表述能力,分析不同运行场景下,数据信息是否能够达到软件自主运行或数据多维管理需求之中,以期在繁琐的数据流程之内进行针对性管控,消减复杂工序引发的漏洞问题。此类项目管理工作的实现,应当具备数据检索功能,且按照数据信息之间的比对关系,创设具有组织性的关联模型,例如,通过特征构造中的统计量特征点、时间与空间特征点,对软件项目运行过程中产生的数据值进行计数、求和、比例与标准差处理,每项数据信息的调控方式则应充分表述软件项目在不同运营模式下产生的数据关系,如此一来,才可最大限度增强数据信息在软件运行场景内的曝光率。企业则可按照不同数据点分析软件项目管理期间存在的问题,并加以控制,提高项目管理能力。
3.3软件开发过程中故障检测
软件系统在开发及运行过程中,需综合考量到不同数据点或者程序驱动过程中可能存在的问题点并加以控制,才可最大限度确保数据信息的传输范畴或者功能组成符合数据挖掘技术的功能驱动机制。软件开发中的故障检测则是借助数据挖掘功能进行规则性、逻辑性处理,保证软件系统运行过程中的程序驱动行为符合常态运行需求。一般情况下,软件功能的介入点或程序设定机制,需按照特定的规则程序作为后期时态表达的承载体,通过API及闭环的验证机制,可及时查证软件模拟运行中存在的故障点。对此,系统运行过程中,需综合考虑到软件规则化运行可能存在的问题点,并按照预设好的程序进行规划处理,增强数据信息的界定能力,及时排查软件系统运行期间的故障点[6]。
4数据挖掘技术在软件开发中的应用实例
4.1嵌入式软件的开发
借助数据挖掘技术,可深度分析软件运行过程中的需求点,并结合外部应用环境、内部开发环境等,理清软件在设计、测定、试运行期间可能存在的问题。嵌入式软件开发应注重对内部流程点的分析,做好系统应用、组件应用之间的对接,提升软件与功能实现之间的一致性[7]。
4.2 B/S结构开发
B/S结构具有动态性特点,其在软件中的融合应用,可保证系统内部数据信息的基础罗列符合系统稳定、可靠运行的需求,然后结合Web的多层应用机制,创设具有动态性、平衡性的体系架构。注意应用器的配置条件,增强B/S结构的可负载性,如图1所示为B/S结构开发流程。
5结语
综上所述,软件工程作为计算机领域、信息工程领域发展的关键所在,伴随大数据、云环境、人工智能的高速发展,传统软件系统的开发模式、运行模式已经无法适应当下多元、高效的软件市场。对此,应加强分析数据挖掘技术的应用属性及其价值,结合数据挖掘功能、模型重构功能等,理清技术与软件开发之间的关联性,提高软件系统的开发质量。后续发展中,软件工程行业应加大研发力度,融合先进的技术体系、研发经验等,拓宽软件应用范畴,从本质层面增强我国软件市场的占有率。
参考文献
[1]宋钰.数据挖掘技术在软件开发中的应用探究[J].软件,2021,42(9):158-160.
[2]刘知云.关于数据挖掘技术在软件工程中的应用分析[J].电脑知识与技术,2021,17(24):27-28.
[3]李一杨,熊冬梅.大数据时代高校学生信息化管理数据挖掘系统[J].信息技术,2021(8):48-52.
[4]李斌.基于数据挖掘的网络安全可视化管理系统的研究[J].电脑知识与技术,2021,17(13):33-35.
[5]王春明.在软件工程中数据挖掘技术的应用探索[J].科技资讯,2021,19(12):42-44.
[6]张建新.软件工程数据挖掘技术应用分析[J].信息记录材料,2021,22(03):163-164.
[7]张洋,王涛,尹刚,等.面向智能化软件开发的开源生态大数据[J].大数据,2021,7(01):94-106.
关注SCI论文创作发表,寻求SCI论文修改润色、SCI论文代发表等服务支撑,请锁定SCI论文网!
文章出自SCI论文网转载请注明出处:https://www.lunwensci.com/jisuanjilunwen/51192.html