推荐系统：简单的基于用户的协同过滤，以精确度和召回率进行评估

发布于 2024-11-06 19:33:33 字数 245 浏览 12 评论 0原文

我正在寻找一个非常简单的基于用户的Java实现协作过滤。我想用 movielens 数据集评估这个 CF 的精确度和召回率。我发现性能 (F1) 应该在 20% 到 30% 左右（使用 Pearson 相似度和 KNN）。

这个简单的框架是否存在用于评估精确度和召回率代码？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

撩人痒 2024-11-13 19:33:33

Apache Mahout 可以完成您在此处提到的所有操作。它基于 Java，并通过 GenericUserBasedRecommender 支持基于用户的协作过滤（等等）。它是一种 k 最近邻算法，您可以在其中插入相似性实现，例如 PearsonCorrelationSimilarity 等。

查看 org.apache.mahout.cf.taste 包和子包。在 .impl.eval 子包中找到 GenericRecommenderIRStatsEvaluator。这将运行一个报告精度、召回率和 F1 的测试。

最后，mahout-examples 中已经有一些基于 GroupLens 的工作示例。