- 本书赞誉
- 前言
- 目标读者
- 不适合阅读本书的读者
- 本书结构
- 什么是数据处理
- 遇到困难怎么办
- 排版约定
- 使用代码示例
- 致谢
- 第 1 章 Python 简介
- 第 2 章 Python 基础
- 第 3 章 供机器读取的数据
- 第 4 章 处理 Excel 文件
- 第 5 章 处理 PDF 文件 以及用 Python 解决问题
- 第 6 章 数据获取与存储
- 第 7 章 数据清洗:研究、匹配与格式化
- 第 8 章 数据清洗:标准化和脚本化
- 第 9 章 数据探索和分析
- 第 10 章 展示数据
- 第 11 章 网页抓取:获取并存储网络数据
- 第 12 章 高级网页抓取:屏幕抓取器与爬虫
- 第 13 章 应用编程接口
- 第 14 章 自动化和规模化
- 第 15 章 结论
- 附录 A 编程语言对比
- 附录 B 初学者的 Python 学习资源
- 附录 C 学习命令行
- 附录 D 高级 Python 设置
- 附录 E Python 陷阱
- 附录 F IPython 指南
- 附录 G 使用亚马逊网络服务
- 关于作者
- 关于封面
14.1 为什么要自动化
自动化提供了一种轻松运行脚本的方式,而不需要在本地机器上执行脚本,甚至不需要你醒着!自动化的能力意味着你可以把时间花在其他的思维密集型项目上。如果拥有一个完备的脚本来执行数据清洗,你就可以专注于研究数据,写出更好的报告。
下面是一些自动化可以帮上忙的示例。
· 每周二输出一些新的分析结果;你要编制一份报告,并将其发送给相关方。
· 其他部门或同事需要能够在没有你的指导和支持下运行报告工具或清洗工具。
· 你需要每周进行一次数据下载、清洗和发送。
· 每次用户请求新报告,报告脚本需要运行,并且在报告生成后通知用户。
· 你需要每周清洗一次数据库里错误的数据,并且将其备份到其他地方。
这其中的每一个问题都有无数的解决方案,但是有一件事是确定的:它们是非常适合自动化的任务。它们的输出和步骤非常清晰。它们有一个有限但特定的听众群体。它们有确定的时间或事件来触发行动。此外,在特定的环境下它们都是可以用脚本和程序解决的事情。
当任务清晰、定义完整,并且输出非常容易确定的时候,自动化是最容易的。不管怎样,即使输出并不总是很容易测试或预测,自动化也可以帮助完成任务的一部分,把剩余的留给你(或其他人)更细致地研究和分析。你可以想象这里的自动化类似于你在生活中自动化其他的事情。你可能有一个最喜欢的已保存的比萨订单,或者一个邮件的自动回复。如果一个任务输出明确并定期发生,那么这是一个很适合自动化的任务。
但是什么时候不应该自动化呢?以下条件预示着该任务不是一个好的自动化选择。
· 任务很少发生,并且非常复杂,自己做更好(例如,填写报税单)。
· 任务的成功输出很难确定(例如,小组讨论、社会研究或调查)。
· 任务需要与人交互来确定合适的完成方式(例如,交通导航、诗歌翻译)。
· 任务成功是当务之急。
其中的一些例子,尤其是需要人工输入的例子,适合一定程度的自动化。有些任务可以通过让机器寻找建议来做部分自动化,之后再确定这些建议是对还是错(使用人工反馈的机器学习)。其他的任务,比如少见又复杂的任务,或者是非常重要的商业任务,随着对任务的熟悉,可能最后会实现自动化或部分自动化。但是你可以看到整体的逻辑来确定什么时候自动化更好,什么时候这不是一个好的想法。
如果你不确定自动化是否适合你,可以尝试自动化一些定期运行的小任务,看它如何工作。一段时间后,你很可能会发现更合适的解决方案,而且自动化一件事的经验会使你在未来自动化更多的事情更加容易。
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论