- 本书赞誉
- 前言
- 目标读者
- 不适合阅读本书的读者
- 本书结构
- 什么是数据处理
- 遇到困难怎么办
- 排版约定
- 使用代码示例
- 致谢
- 第 1 章 Python 简介
- 第 2 章 Python 基础
- 第 3 章 供机器读取的数据
- 第 4 章 处理 Excel 文件
- 第 5 章 处理 PDF 文件 以及用 Python 解决问题
- 第 6 章 数据获取与存储
- 第 7 章 数据清洗:研究、匹配与格式化
- 第 8 章 数据清洗:标准化和脚本化
- 第 9 章 数据探索和分析
- 第 10 章 展示数据
- 第 11 章 网页抓取:获取并存储网络数据
- 第 12 章 高级网页抓取:屏幕抓取器与爬虫
- 第 13 章 应用编程接口
- 第 14 章 自动化和规模化
- 第 15 章 结论
- 附录 A 编程语言对比
- 附录 B 初学者的 Python 学习资源
- 附录 C 学习命令行
- 附录 D 高级 Python 设置
- 附录 E Python 陷阱
- 附录 F IPython 指南
- 附录 G 使用亚马逊网络服务
- 关于作者
- 关于封面
G.1 启动 AWS 服务器
为了启动一个服务器,在 AWS 控制台(https://console.aws.amazon.com)选择“Compute”下的“EC2”(你需要登录或创建一个账户来访问控制台)。这会带你来到 EC2 着陆页(https://console.aws.amazon.com/ec2/v2/home)。在这里,点击“Launch Instance”按钮。
这时,你会开始跟随一个教程来设置你的实例。你在这里选择的所有东西都是可编辑的,所以不知道选择什么也不必担心。这本书提供了以廉价又快速的方式设置并运行服务器的建议,但这不意味着这就是你需要的解决方案。如果你碰到了空间等问题,可能需要一个更大因而也更贵的配置 / 实例。
在下面的这一小节里,我们会带着你浏览一遍我们推荐的设置。
G.1.1 AWS步骤1:选择一个亚马逊机器镜像(AMI)
机器镜像基本上是一个操作系统镜像(或快照)。最普遍的操作系统是 Windows 和 OS X。然而,基于 Linux 的系统通常用作服务器。我们推荐最新的 Ubuntu 系统,在本书编写时的版本为“Ubuntu Server 14.04 LTS (HVM), SSD Volume Type - amid05e75b8”。
G.1.2 AWS步骤2:选择一个实例类型
实例类型是你启动的服务器的容量。选择“t2.micro (Free tier eligible)”。不要扩容,除非你明确需要,因为这样会浪费钱。为了学习更多关于实例的知识,查看 AWS 关于实例类型(https://aws.amazon.com/ec2/instance-types/)与价格(https://aws.amazon.com/ec2/pricing/)的文章。
选择“Review and Launch”,这将带你到第 7 步。
G.1.3 AWS步骤7:学习实例启动
在页面的顶部,你会注意到一条信息:“提高你的实例安全。你的安全组,launch-wizard-4,正对全世界开放。”对于真正的产品实例,或带有敏感信息的实例,强烈建议提高安全,同时采用其他的安全措施。查看 AWS 的文章“加强你的 EC2 实例安全的建议”(https://aws.amazon.com/articles/1233/)。
G.1.4 AWS额外问题:选择一个存在的键对或创建一个新的
一个键对类似于一个服务器的键集合,这样服务器知道谁有权利使用。选择“Create a new key pair”并且给它命名。我们已经命名我们的实例为 data-wrangling-test,但是你可以给它取任何你可以识别的名字。当你完成时,下载键对到一个你可以在随后找到的地方。
最后,点击“Launch Instances”。启动实例后,你会在屏幕上得到一个实例 ID。
如果你担心服务器花销,在 AWS 首选项中创建一个账单报警(https://console.aws.amazon.com/billing/home?#/preferences)。
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论