数据分析实战 PDF 文档
本书由实战经验丰富的两位数据分析师执笔,首先介绍了商业领域里通用的数据分析框架,然后根据该框架,结合 8 个真实的案例,详细解说了通过数据分析解决各种商业问题的流程,让读者在解决问题的过程中学习各种数据分析方法,包括柱状图、交叉列表统计、A/B 测试、多元回归分析、逻辑回归分析、主成分分析、聚类、决策树分析、机器学习等。特别是书中使用的数据都是未经清洗的原始数据,能够让读者了解真实的数据分析流程,避免纸上谈兵。
本书适合各大公司的算法工程师、数据分析师、数据挖掘工程师以及今后立志从事相关工作的高校学生阅读。
伴随着互联网的高速发展和以云计算为代表的技术创新,过去难以收集和存储的大量数据得以集中管理和使用,大数据时代已经来临。然而,如何发掘大数据这座金矿,使之在商业领域体现其最终价值,这属于数据科学(Data Science)的范畴,也是数据科学家(Data Scientist)的工作职责所在。
要想成为一名合格的数据科学家,不仅需要拥有深厚的统计学等理论基础,更需要有较强的业务能力、对数据的敏感性以及处理实际商业数据的经验。对于这一点我深有体会。在日本留学期间我有幸进入乐天技术研究所(Rakuten Institute of Technology),这也是我第一次接触到生产环境下的数据。然而在面对公司实际问题时,我拿着海量的各种日志数据却经常有种不知从何下手的感觉。
目录
第 1 章 数据科学家的工作
1.1 什么是数据科学家
1.2 3 种类型的数据科学家
1.3 数据科学家的现状
第 2 章 商业数据分析流程
2.1 数据分析的 5 个流程
2.2 现状和预期
2.3 发现问题
2.4 数据的收集和加工
2.5 数据分析
2.6 解决对策
2.7 小结
[ 分析基础] 篇
第 3 章 案例❶—柱状图 为什么销售额会减少
3.1 现状和预期
3.2 发现问题
3.3 数据的收集和加工
3.4 数据分析
3.5 解决对策
3.6 小结
3.7 详细的 R 代码
第 4 章 案例❷—交叉列表统计 什么样的顾客会选择离开
4.1 现状和预期
4.2 发现问题
4.3 数据的收集和加工
4.4 数据分析
4.5 解决对策
4.6 小结
4.7 详细的 R 代码
第 5 章 案例❸—A/B 测试 哪种广告的效果更好
5.1 现状和预期
5.2 发现问题
5.3 数据的收集和加工
5.4 数据分析
5.5 解决对策
5.6 小结
5.7 详细的 R 代码
第 6 章 案例❹—多元回归分析 如何通过各种广告的组合获得更多的用户
6.1 现状和预期
6.2 发现问题
6.3 数据的收集
6.4 数据分析
6.5 解决对策
6.6 小结
6.7 详细的 R 代码
[ 分析应用] 篇
第 7 章 案例❺—逻辑回归分析 根据过去的行为能否预测当下
7.1 期望增加游戏的智能手机用户量
7.2 是用户账号迁转设定失败导致的问题吗
7.3 在数据不包含正解的情况下收集数据
7.4 验证是否能够建立模型
7.5 解决对策
7.6 小结
7.7 详细的 R 代码
第 8 章 案例❻—聚类 应该选择什么样的目标用户群
8.1 希望了解用户的特点
8.2 基于行为模式的用户分类
8.3 把主成分作为自变量来使用
8.4 进行聚类
8.5 解决对策
8.6 小结
8.7 详细的 R 代码
第 9 章 案例❼—决策树分析 具有哪些行为的用户会是长期用户
9.1 希望减少用户开始游戏后不久就离开的情况
9.2 了解“乐趣”的结构
9.3 把类作为自变量
9.4 进行决策树分析
9.5 解决对策
9.6 小结
9.7 详细的 R 代码
第 10 章 案例❽—机器学习 如何让组队游戏充满乐趣
10.1 使组队作战的乐趣最大化
10.2 利用数据分析为服务增加附加价值
10.3 在数据中排除星期的影响
10.4 构建预测模型
10.5 解决对策
10.6 小结
10.7 详细的 R 代码
下载地址:https://www.wenjiangs.com/wp-content/uploads/2024/04/vTuxdq7254NPPuHD.zip
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论