SCI论文(www.lunwensci.com)
摘要:基于计算机技术的信息管理系统的应用日益广泛,将多种独立运行的系统高度集成,提供一个统一的管控平台在企业中已经成为一种发展趋势。针对该需求,IT应用厂商纷纷以Web服务的形式对外广告发布系统访问信息。如何从众多的Web服务中发现满足要求的服务,已经成为系统集成领域研究的热点问题之一。本文通过引入语义网模型,对服务类型、服务接口、服务质量分别匹配,提升了服务发现结果的查全率和查准率,对于语义Web服务的发展及其在系统集成领域的应用有一定的理论和实践意义。
关键词:信息管理系统;Web服务;系统集成;语义网模型
A Semantic Based Web Service Discovery Method
DENG Wei
(Shaanxi Normal University,Xi'an Shaanxi 710062)
【Abstract】:The application of information management system based on computer technology is becoming more and more extensive.It has become a development trend in enterprises to highly integrate a variety of independent systems and provide a unified management and control platform.In response to this demand,IT application manufacturers have used the form of Web services to access the information of external advertising publishing system.How tofind services that meet the requirements from many Web services has become one of the hot issues in thefield of system integration.By introducing the semantic Web model,this paper matches the service category,service interface and service quality in turn,and effectively improves the precision and recall of service discovery result.It has certain theoretical and practical significance for the development of Semantic Web services and its application in thefield of system integration.
【Key words】:information management system;Web services;system integration;semantic web model
0前言
传统的Web发现方法通过对应用商发布的Web服务广告中的描述性文字进行关键字检索来查找服务信息[1],查准率和查询率较低,例如查找“电脑资产登记”服务会忽视“计算机资产登记”的服务广告。
1998年Tim Berners-Lee提出语义Web概念[2],之后出现了基于语义网的Web服务发现方法,该方法首先建立本体库,服务广告和服务请求中的参数均用本体库中的概念表示,查找阶段采用特定算法计算服务请求和服务广告参数的匹配程度来获得可能符合需求的服务。目前查找阶段的算法大都基于Massimo Paolucci提出的弹性匹配算法,将匹配程度分为四种等级[3],但是无法进一步区分属于同一等级中的两个Web服务的匹配程度。
1核心算法
本文提出了一种分级匹配算法,首先建立服务类型Service.Category并根据文献[4]中的方法建立本体库Service.owl。发布阶段的服务广告和查询阶段的服务请求均遵循(Name,Desc,Cat,I,O,QoS)五元组的形式,其中Name为服务名称,Desc为服务描述信息,Cat为服务类型,用Service.Category中的节点表示,I为输入参数集合,O为输出参数集合,IO参数均用Service.owl中的概念节点表示,QoS为服务质量。
查找阶段依次对服务请求和服务广告服务类型、服务接口、服务质量进行匹配,将各级匹配的结果加权后计算出服务匹配的最终相似度。下面具体阐述本文的分级匹配算法。
2服务类型匹配
基于服务类型的匹配首先需要构建服务类型目录。服务类型的匹配就是找出与服务请求有相同或类似服务类型的服务广告列表。所有的服务类型被存放在目录树型结构。如图1所示为一棵抽象服务类型目录树。在该目录树中,不同节点代表不同的类型,有向边表示类型间的泛化关系。
两个服务类型的相似程度通过以下定义的类型相似度来进行比较。
令Cat为分类树上的一个节点,则Cat的所有祖先以及Cat自身组成了一个非空集合,这个非空集合称之为Cat的上层类型,记为UpCategoryCat。
任何两个类型Cati和Catj之间的类型相似度SimCat(Cati,Catj)介于[0,1]之间,其值可由公式(1)得到。
式(1)中|UpCategoryCati∩UpCategoryCatj|表示Cati和Catj上层类型交集的元素个数。|UpCategoryCati∪UpCategoryCatj|表示Cati和Catj上层类型并集的元素个数。
当Cati和Catj属于同一类型时,即Cati=Catj时,SimCat(Cati,Catj)=1。
当Cati和Catj不存在公共的上层类型时,即UpCategoryCati∩UpCategoryCatj=∅时,SimCat(Cati,Catj)=0。
类型相似度的值越接1,服务广告和服务请求之间的类型越相近。在实际应用中,可根据需要设置一个阈值,当类型相似度小于阈值时就认为服务广告和服务请求不属于同一类型,返回匹配失败的结果。
3服务接口匹配
服务接口实际的表现形式为服务的输入和输出参数,代表了该服务对外公布的功能。在发布服务广告和进行服务查找时,输出和输入参数均用本体库中的概念表示。本方法将输出输入参数的相似度定义为匹配等级度和语义相似度的算数平均值,如公式(2)所示。
匹配等级度Simg通过对弹性匹配算法中的各等级用一个[0,1]的数字进行量化而得,对应的数值如表1所示。
Depth(C)表示本体库中概念C对应节点的深度。
Dist(C1,C2)表示概念C1和概念C2间的语义距离,领域本体的概念之间形成有向图,Dist(C1,C2)为连接它们最短路径上的n条边的权值的总和,计算方法如公式(4)所示。
其中weighti是连接C1,C2的最短路径上第i条边上的权值,权值定义方式如公式(5)所示。
式(5)中weight(C1,C2)表示相邻两个概念C1和C2边的权值,其中C1为C2的父节点,parent(C1)表示概念C1的父节点,weight(parent(C1),C1)表示概念C1与其父节点之间的边的权值,|children(C1)|表示概念树中C1的子节点个数。
根据公式(2)得到服务请求的每个输入输出参数的语义相似度之后,就可以进行服务接口相似度的计算。
服务输出匹配度计算方法如公式(6)所示。
式(6)中Ores表示服务请求输出参数集合,|Ores|表示服务请求输出集合包含参数的数目。Simmax(o,Oads)表
示服务广告的输出参数集合中与请求的特定输出参数相似度程度最高的参数对应的相似度值。
输入相似度计算方法与输出相似度计算方法类似,如公式(7)所示。
服务接口相似度综合了输出相似度和输入相似度的结果,如公式(8)所示。
在系统响应时间方面,基于关键字文本相似度的方法仅需进行简单的字符串匹配,所以其响应时间最短。本文的分级匹配方法在服务发布阶段进行了预处理,在查询阶段只需要对服务索引库进行相应的检索,响应时间也在用户可以接受的范围内。本文实现的弹性匹配算法服务发布时也在服务索引库中建立了索引,由于其仅进行功能匹配且不需检索概念间的语义相似度,因而响应时间小于本文的分级算法。
6结语
实验结果表明,本文提出的分级匹配算法在查全率和查准率方面均高于传统的基于关键字文本相似度的匹配方法和弹性匹配算法,具备较强的服务发现能力,同时查询响应时间也在可以接受的范围内,在企业系统集成领域的服务查询层面具有一定的实用价值。
参考文献
[1]于扬,邢镔,曾骏,等.KSN:一种基于知识图谱和相似度网络的Web服务发现模型[J].计算机科学,2021,48(10):160-166.
[2]连飞,刘奎.一种基于语义Web的Web服务发现方法[J].计算机技术与发展,2008,018(007):63-65.
[3]PAOLUCCI M,PAYNE T,SYCARA K,et al.Semantic matching of web services capabilities[C]∥First International Semantic Web Conference.Sardinia,Italy:Springer,2002:333-347.
[4]余凡.领域本体构建方法及实证研究[D].武汉:武汉大学,2013.
[5]高文斌,董晨辰,王睿,等.基于QoS感知的Web服务推荐算法综述[J].计算机时代,2022(3):1-4+10.
[6]吴胜利,谭延之,施化吉.搜索引擎指标综合特性的评价[J].江苏大学学报(自然科学版),2015,36(2):181-186+214.
关注SCI论文创作发表,寻求SCI论文修改润色、SCI论文代发表等服务支撑,请锁定SCI论文网!
文章出自SCI论文网转载请注明出处:https://www.lunwensci.com/jisuanjilunwen/51323.html