- 本书赞誉
- 前言
- 目标读者
- 不适合阅读本书的读者
- 本书结构
- 什么是数据处理
- 遇到困难怎么办
- 排版约定
- 使用代码示例
- 致谢
- 第 1 章 Python 简介
- 第 2 章 Python 基础
- 第 3 章 供机器读取的数据
- 第 4 章 处理 Excel 文件
- 第 5 章 处理 PDF 文件 以及用 Python 解决问题
- 第 6 章 数据获取与存储
- 第 7 章 数据清洗:研究、匹配与格式化
- 第 8 章 数据清洗:标准化和脚本化
- 第 9 章 数据探索和分析
- 第 10 章 展示数据
- 第 11 章 网页抓取:获取并存储网络数据
- 第 12 章 高级网页抓取:屏幕抓取器与爬虫
- 第 13 章 应用编程接口
- 第 14 章 自动化和规模化
- 第 15 章 结论
- 附录 A 编程语言对比
- 附录 B 初学者的 Python 学习资源
- 附录 C 学习命令行
- 附录 D 高级 Python 设置
- 附录 E Python 陷阱
- 附录 F IPython 指南
- 附录 G 使用亚马逊网络服务
- 关于作者
- 关于封面
15.3 下一步做什么
下一步你会怎么做?你拥有很多新技能,并且能够质疑自己的假设和发现的数据。你还有一些 Python 的应用知识,而且很多有用的库触手可及。
如果你对特定的领域或数据集没有热情,你会想要发现新的学习领域,继续你作为一名数据处理者的进程和探索。很多很棒的数据分析师书写了很多激励人心的故事。这里就有一些这样的故事。
· FiveThirtyEight(http://fivethirtyeight.com/),曾是《纽约时报》记者 Nate Silver 的博客,现在是一个拥有众多作家和分析师的站点,研究许多不同的主题。在弗格森大陪审团决定不起诉达伦· 威尔逊后,FiveThirtyEight 发布了一篇文章,显示收入出现了离群现象(https://fivethirtyeight.com/datalab/ferguson-michael-brown-indictment-darren-wilson/)。在一个争议性的话题中,如果有能力展示数据趋势或倾向,将可以帮助我们去除故事中的一些情绪,揭示数据真正想要诉说的东西。
· 《华盛顿邮报》的一项关于收入差距的研究(https://www.washingtonpost.com/news/wonk/wp/2014/11/04/affirmative-action-for-rich-kids-getting-a-job-at-dads-company/?utm_term=.80495391806a)使用税收和人口普查数据得出结论:在择业和初始薪水方面“老同学关系网”(ol'boy network)依然存在,但是在得到第一份工作后,这些关系网通常会弱化或者消失。
· 我们已经研究了非洲雇用童工的组织带来的一些影响,包括挖掘冲突矿产。国际特赦组织(Amnesty International)和全球见证(Global Witness)(http://www.bbc.com/news/business-32403315)近日的一个报道发现,大多数美国公司没有充分检查供应链,来确保没有使用冲突矿产。
这个世界还有数不清的未讲述的故事。如果你有激情或信念,很可能你的观点和数据处理技术可以帮助人们和社区。如果你没有激情,我们鼓励你通过跟进新闻、文档和网络上的数据分析,不断地学习。
无论你的兴趣是什么,都有无限的可能性去深入学习和掌握本书中介绍的概念。任何最能激发你兴趣的事情,就是未来学习的最好途径。我们希望这本书只是你数据处理者生涯的一个起点。
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论