返回介绍

1.基于物品的协同过滤

发布于 2024-01-28 21:41:24 字数 987 浏览 0 评论 0 收藏 0

基于协同过滤推荐算法包括两部分:基于用户的协同过滤推荐和基于物品的协同过滤推荐。本文结合实际的情况,选择基于物品的协同过滤算法进行推荐,其模型构建的流程如图12-10所示。

其中,训练集与测试集是通过交叉验证的方法划分后的数据集。通过协同过滤算法的原理可知,在建立推荐系统时,建模的数据量越大,越能消除数据中的随机性,得到的推荐结果对比数据量小要好。但是数据量越大,模型建立以及模型计算耗时就越久。因此本文选择数据处理后的婚姻与咨询的数据,其数据分布情况见表12-26。在实际应用中,应当以大量的数据进行模型构建,得到的推荐结果相对会好些。

图12-10 基于物品协同过滤建模流程图

表12-26 模型数据统计表

由于在实际数据中,物品数目过多,建立的用户物品矩阵与物品相似度矩阵是一个很庞大的矩阵。因此,在用户物品矩阵的基础上采用杰卡德相似系数的方法,计算出物品相似度矩阵。通过物品相似矩阵与测试集的用户行为,计算用户的兴趣度,获得推荐结果,进而计算出各种评价指标。

为了对比个性化推荐算法与非个性化推荐算法的好坏,本文选择了两种非个性化算法和一种个性化算法进行建模并对其进行模型评价与分析。两种非个性化算法为:Random算法和Popular算法。其中,Random算法是每次都随机挑选用户没有产生过行为的物品并推荐给他。Popular算法是按照物品的流行度,为用户推荐他没有产生过行为的物品中最热门的物品。个性化算法为基于物品的协同过滤算法。利用3种算法,采用相同的交叉验证的方法,对数据进行建模分析,获得各个算法的评价指标。

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。
列表为空,暂无数据
    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文