算法-计算用户相似度算法
如题,根据用户行为分析用户相似度,从而给指定用户推荐相似度最高的用户为社区好友。
现在已知几种:
余弦相似性
皮尔森系数
调整余弦相似性
欧几里得距离(欧式距离)
等算法,但是不知道个有什么优缺点。。 请大家对这问题发表下见解。。。
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
如题,根据用户行为分析用户相似度,从而给指定用户推荐相似度最高的用户为社区好友。
现在已知几种:
余弦相似性
皮尔森系数
调整余弦相似性
欧几里得距离(欧式距离)
等算法,但是不知道个有什么优缺点。。 请大家对这问题发表下见解。。。
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
接受
或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
发布评论
评论(1)
余弦相似性:把用户评分看作是n维项目空间上的向量,通过计算两个向量之间的夹角余弦来度量两个用户之间的相似性。
皮尔森系数:又称相关相似性,通过Peason相关系数来度量两个用户的相似性。计算时,首先找到两个用户共同评分过的项目集,然后计算这两个向量的相关系数。
调整余弦相似性:将余弦相似性中的向量,减去用户平均评分向量后,再计算夹角余弦以修正不同用户评分尺度不同的问题。
在数据比较稀疏的情况下,这几种方法均存在一定问题:余弦相似性和调整余弦相似性对于用户未评价项目评分为0的假设;皮尔森系数中用户共同评分项目集可能很小。