Sci论文 - 至繁归于至简,Sci论文网。 设为首页|加入收藏
当前位置:首页 > 计算机论文 > 正文

基于用户和内容的混合模式推荐算法研究论文

发布时间:2022-06-13 09:41:54 文章来源:SCI论文网 我要评论














SCI论文(www.lunwensci.com):
 
  摘要:推荐系统中的协同过滤算法和基于内容推荐算法都能够进行相关推荐,但是算法中存在的不足会导致推荐结果不准确。为提高推荐准确度,本文提出一种混合模式的推荐算法,建立用户的兴趣模型,对目标用户进行个性化的物品推荐。最后利用Movies Lens数据集进行训练并评估基于用户和基于内容的混合模式推荐算法的准确度。
 
  关键词:协同过滤;内容过滤;混合推荐
 
  Research on Mixed Mode Recommendation Algorithm Based on User and Content
 
  LI Panying,HAN Yuxuan,WEN Xiumei
 
  (Hebei Institute of Architecture and Engineering,Zhangjiakou Hebei 075000)
 
  【Abstract】:Both the collaborative filtering algorithm and the content-based recommendation algorithm in the recommendation system can make relevant recommendations,but the deficiencies in the algorithms can lead to inaccurate recommendation results.In order to improve the recommendation accuracy,this paper proposes a mixed-mode recommendation algorithm,establishes a user's interest model,and recommends personalized items to target users.Finally,the Movies Lens dataset is used to train and evaluate the accuracy of the user-based and content-based hybrid mode recommendation algorithm.
 
  【Key words】:collaborativefiltering;contentfiltering;hybrid recommendation
  0引言
 
  人们身处信息快速增长的时代,想要及时并准确地获取自己感兴趣的信息往往存在一定的困难。推荐系统的产生可以解决这一问题。推荐系统中典型的推荐算法有基于协同过滤算法和基于内容推荐算法。其中,协同过滤推荐算法的一个显著优点是收集到的用户-物品评分矩阵越为密集推荐效果就会越好,且这种算法不需要收集物品的其他信息,但是导致该算法会过分依赖评分数据集。基于内容的推荐算法是建立在对物品的特征提取的基础之上,对评分数据的依赖要小得多。即使没有物品评分矩阵也可以根据物品的特征信息来进行推荐,但缺点是推荐结果缺乏新颖性,不能产生个性化推荐[1]。
 
  因此,通过结合上述两种算法的优缺点,提出一种融合思想,使两种算法进行相互补充以解决推荐算法中的不足,从而可以得到更好的推荐效果。
 
  1混合模式推荐算法概述
 
  1.1混合模式推荐技术
 
  对于传统的协同过滤推荐算法过分依赖评分数据集的问题,可以采用与基于内容过滤相结合的混合模式算法加以解决。通过Pearson相关系数计算公式得到用户兴趣模型和物品特征向量间的相似度,最后将相似性较高的物品推荐给目标用户。基于内容过滤的推荐算法不受冷启动和数据稀疏性的影响,利用基于内容推荐的这一优势使得物品在没有用户评价的情况下也可以进行推荐。
 
  随着物品数量的剧增,物品的特征信息数量也在增加,导致内容推荐系统的效率和质量都会下降[2]。可以采用与基于协同过滤推荐算法相结合的方式进行解决,利用用户-物品的评分数据,对于感兴趣和暂时不感兴趣的物品分别给予不同的评分级别,根据评分数据计算与目标用户兴趣相近的用户集合,从而为目标用户推荐感兴趣但未产生过行为的物品集。

\
 
  针对基于内容和基于协同过滤算法存在的优缺点,将二者进行融合,形成基于用户和内容的混合模式推荐算法,提高系统的整体性能,给用户提供更好的个性化服务。
 
  1.2 Pearson相关系数
 
  在推荐系统中往往可以遇到这样的情况:对于同一个物品,用户A非常喜欢,就给出了8分;用户B也很喜欢但给出了5分。可以看出用户A和用户B的打分准则并不一样,用户不同,相应分数也不一样。对于这种情况,改进的Pearson相关系数可以进行处理[3]。
 
  本文中涉及到相似度计算采用的计算公式是Pearson相关系数。公式中的Sxy表示用户x与用户y产生过共同行为的物品交集,rxs为用户x对物品s的评分。和传统的计算公式不一样的是,改进的Pearson相关系数只关注两个用户间感兴趣的物品的交集Sxy。公式(1)为改进后的Pearson相关系数计算公式。

\
 
  1.3混合模式推荐算法的工作流程
 
  1.3.1基于内容推荐算法CB
 
  在基于内容的推荐算法CB中,首先需要对数据集进行预处理,把原始数据分类整合,按指定顺序排列所有标签、提取所有物品的名称后创建一个01矩阵,进行整合得到物品画像。再根据用户历史物品评分数据,和感兴趣物品所属类型整合得到用户画像。进行相似度计算将最终推荐物品按相似度进行降序排序,取TopN个物品。
 
  基于内容的推荐算法CB的具体实现步骤:
 
  (1)刻画物品画像。把收集并整理的“推荐物品集及所属类型”表转换成所能识别的01矩阵,按照指定顺序排列所有标签以及按顺序提取所有物品名称来作为01矩阵的横纵坐标,根据统计出来的物品类型信息填充矩阵内容,其中0表示该物品不属于此类型,1表示该物品属于此类型;
 
  (2)刻画用户画像。统计所有用户产生过行为的物品名all_items_users_saw=[item2,item3,item4]以及所有用户产生过行为的物品所对应的类型all_items_ users_saw_labels=["label2 label3","label3",...],生成所有用户产生过行为及所属类型的01矩阵。
 
\
 
  (3)得出推荐集。根据收集到的用户-物品评分矩阵以及该物品所属类型的01矩阵得到用户画像,得到的用户画像是一个01矩阵,矩阵中的行向量表示用户对各个类型的评分,然后将用户画像与物品画像(某个物品具备哪些类型)进行相似度计算,并按相似度进行降序排序进行TopN推荐。
 
  1.3.2基于用户的协同过滤推荐算法UserCF
 
  前面已经介绍到,协同过滤算法比较依赖评分矩阵,所以该算法的实现步骤不像基于内容推荐算法复杂。本文着重介绍协同过滤算法中基于用户的推荐算法。
 
  在基于用户的协同过滤算法中,为实现个性化推荐,首先需要计算用户间的相似度(找到和目标用户兴趣相似的用户集合),本文选取的是改进的Pearson相关系数进行相似度计算,对于得到的近邻用户集,找到和目标用户U最相似的K个用户产生N个推荐。注意被推荐的物品应该不包含该用户曾产生过行为的物品。
 
  1.3.3基于用户和内容的混合模式推荐
 
  需要将基于用户的协同过滤推荐和基于内容的推荐算法进行加权融合,通过调整加权系数,进行大量计算验证混合模式下的推荐算法的推荐效果。
 
  混合推荐流程图如图1所示。
 
  2实验结果
 
  2.1数据集介绍
 
  本文使用的是推荐系统中经典的Movie Lens(ml-100k)数据集来验证传统的基于用户和基于内容的混合模式推荐算法一些性能指标。数据集中存储了10万多条用户对电影的评分数据,其中数据评分值为1到5,数据集情况如表1所示。

\
 
  系统在提供推荐服务时,一般是给用户提供一张个性化的推荐列表,这种推荐叫做TopN推荐[4]。TopN推荐的评价指标一般选取的是准确率(Precision)和召回率(Recall)。
 
  2.2实验结果与分析
 
  在基于内容和基于用户的混合模式推荐中,经过实验研究与分析,最终确定加权系数α的分配比例是0.75和0.25。在实验验证分析中,推荐物品的数目依次设置为5,10,15,20,25,30,近邻用户数设置为10。测评结果如图2,图3所示。
 

\

\
  本文从近邻用户数、推荐物品数的选取以及数据集的划分,进行多种情况的实验论证。最终经过实验对比分析可得,无论是从评价指标准确率还是召回率来看,基于混合的推荐算法都要优于基于用户和基于内容的推荐算法。
 
  3结语
 
  为解决协同过滤算法与基于内容推荐算法中存在的缺点,本文提出可以通过使用两者的混合算法来解决存在的不足之处。根据提出的算法思想,进行大量实验验证与分析,基于用户和基于内容的混合模式推荐算法能够使准确率和召回率有一定的提升。由此得出,本文提出的混合模式推荐算法可以使推荐结果更加准确。
 
  参考文献
 
  [1]项亮.推荐系统实践[M].北京:人民邮电出版社,2012:44-64.[2]孟祥武,胡勋,王立才,等.移动推荐系统及其应用[J].软件学报,2013,24(1):91-108.
 
  [3]孟祥武,纪威宇,张玉洁.大数据环境下的推荐系统[J].北京邮电大学学报,2015,38(2):1-15.
 
  [4]王威,郑骏.基于用户相似度的协同过滤算法改进[J].华东师范大学学报(自然科学版),2016(3):60-66.
 
关注SCI论文创作发表,寻求SCI论文修改润色、SCI论文代发表等服务支撑,请锁定SCI论文网!
 

文章出自SCI论文网转载请注明出处:https://www.lunwensci.com/jisuanjilunwen/39060.html

发表评论

Sci论文网 - Sci论文发表 - Sci论文修改润色 - Sci论文期刊 - Sci论文代发
Copyright © Sci论文网 版权所有 | SCI论文网手机版 | 鄂ICP备2022005580号-2 | 网站地图xml | 百度地图xml