推荐系统实践 PDF 文档
本书通过大量代码和图表全面系统地阐述了和推荐系统有关的理论基础,介绍了评价推荐系统优劣的各种标准(比如覆盖率、满意度)和方法(比如 AB 测试),总结了当今互联网领域中各种和推荐有关的产品和服务。另外,本书为有兴趣开发推荐系统的读者给出了设计和实现推荐系统的方法与技巧,并解答了在真实场景中应用推荐技术时最常遇到的一些问题。
本书适合对推荐技术感兴趣的读者学习参考。
推荐在今天互联网的产品和应用中被广泛采用,包括今天大家经常使用的相关搜索、话题推荐、电子商务的各种产品推荐、社交网络上的交友推荐等。但是,至今还没有一本书从理论上对它进行系统地分析和论述。《推荐系统实践》这本书恰恰弥补了这个空白。
目录
第 1 章 好的推荐系统
1.1 什么是推荐系统
1.2 个性化推荐系统的应用
1.2.1 电子商务
1.2.2 电影和视频网站
1.2.3 个性化音乐网络电台
1.2.4 社交网络
1.2.5 个性化阅读
1.2.6 基于位置的服务
1.2.7 个性化邮件
1.2.8 个性化广告
1.3 推荐系统评测
1.3.1 推荐系统实验方法
1. 离线实验
2. 用户调查
3. 在线实验
1.3.2 评测指标
1. 用户满意度
2. 预测准确度
3. 覆盖率
4. 多样性
5. 新颖性
6. 惊喜度
7. 信任度
8. 实时性
9. 健壮性
10. 商业目标
11. 总结
1.3.3 评测维度
第 2 章 利用用户行为数据
2.1 用户行为数据简介
2.2 用户行为分析
2.2.1 用户活跃度和物品流行度的分布
2.2.2 用户活跃度和物品流行度的关系
2.3 实验设计和算法评测
2.3.1 数据集
2.3.2 实验设计
2.3.3 评测指标
2.4 基于邻域的算法
2.4.1 基于用户的协同过滤算法
1. 基础算法
2. 用户相似度计算的改进
3. 实际在线系统使用 UserCF 的例子
2.4.2 基于物品的协同过滤算法
1. 基础算法
2. 用户活跃度对物品相似度的影响
3. 物品相似度的归一化
2.4.3 UserCF 和 ItemCF 的综合比较
哈利波特问题
2.5 隐语义模型
2.5.1 基础算法
2.5.2 基于 LFM 的实际系统的例子
2.5.3 LFM 和基于邻域的方法的比较
2.6 基于图的模型
2.6.1 用户行为数据的二分图表示
2.6.2 基于图的推荐算法
第 3 章 推荐系统冷启动问题
3.1 冷启动问题简介
3.2 利用用户注册信息
3.3 选择合适的物品启动用户的兴趣
3.4 利用物品的内容信息
3.5 发挥专家的作用
第 4 章 利用用户标签数据
4.1 UGC 标签系统的代表应用
4.1.1 Delicious
4.1.2 CiteULike
4.1.3 Last.fm
4.1.4 豆瓣
4.1.5 Hulu
4.2 标签系统中的推荐问题
4.2.1 用户为什么进行标注
4.2.2 用户如何打标签
4.2.3 用户打什么样的标签
4.3 基于标签的推荐系统
4.3.1 实验设置
4.3.2 一个最简单的算法
4.3.3 算法的改进
1. TF-IDF
2. 数据稀疏性
3. 标签清理
4.3.4 基于图的推荐算法
用图模型解释前面的简单算法
4.3.5 基于标签的推荐解释
4.4 给用户推荐标签
4.4.1 为什么要给用户推荐标签
4.4.2 如何给用户推荐标签
4.4.3 实验设置
实验结果
4.4.4 基于图的标签推荐算法
4.5 扩展阅读
第 5 章 利用上下文信息
5.1 时间上下文信息
5.1.1 时间效应简介
5.1.2 时间效应举例
5.1.3 系统时间特性的分析
1. 数据集的选择
2. 物品的生存周期和系统的时效性
5.1.4 推荐系统的实时性
5.1.5 推荐算法的时间多样性
5.1.6 时间上下文推荐算法
1. 最近最热门
2. 时间上下文相关的 ItemCF 算法
3. 时间上下文相关的 UserCF 算法
5.1.7 时间段图模型
5.1.8 离线实验
1. 实验设置
5.2 地点上下文信息
基于位置的推荐算法
5.3 扩展阅读
第 6 章 利用社交网络数据
6.1 获取社交网络数据的途径
6.1.1 电子邮件
6.1.2 用户注册信息
6.1.3 用户的位置数据
6.1.4 论坛和讨论组
6.1.5 即时聊天工具
6.1.6 社交网站
1. 社会图谱和兴趣图谱
6.2 社交网络数据简介
社交网络数据中的长尾分布
6.3 基于社交网络的推荐
6.3.1 基于邻域的社会化推荐算法
6.3.2 基于图的社会化推荐算法
6.3.3 实际系统中的社会化推荐算法
6.3.4 社会化推荐系统和协同过滤推荐系统
6.3.5 信息流推荐
6.4 给用户推荐好友
6.4.1 基于内容的匹配
6.4.2 基于共同兴趣的好友推荐
6.4.3 基于社交网络图的好友推荐
离线实验
6.4.4 基于用户调查的好友推荐算法对比
6.5 扩展阅读
第 7 章 推荐系统实例
7.1 外围架构
数据收集和存储
7.2 推荐系统架构
7.3 推荐引擎的架构
7.3.1 生成用户特征向量
7.3.2 特征—物品相关推荐
7.3.3 过滤模块
7.3.4 排名模块
1. 新颖性排名
2. 多样性
3. 时间多样性
4. 用户反馈
7.4 扩展阅读
第 8 章 评分预测问题
8.1 离线实验方法
8.2 评分预测算法
8.2.1 平均值
1. 全局平均值
2. 用户评分平均值
3. 物品评分平均值
4. 用户分类对物品分类的平均值
8.2.2 基于邻域的方法
8.2.3 隐语义模型与矩阵分解模型
1. 传统的 SVD 分解
2. Simon Funk 的 SVD 分解
3. 加入偏置项后的 LFM
4. 考虑邻域影响的 LFM
8.2.4 加入时间信息
1. 基于邻域的模型融合时间信息
2. 基于矩阵分解的模型融合时间信息
8.2.5 模型融合
1. 模型级联融合
2. 模型加权融合
8.2.6 Netflix Prize 的相关实验结果
下载地址:https://www.wenjiangs.com/wp-content/uploads/2024/05/cLRs5rixOHCyOU60.zip
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
上一篇: 图解物联网 PDF 文档
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论