- 本书赞誉
- 前言
- 目标读者
- 不适合阅读本书的读者
- 本书结构
- 什么是数据处理
- 遇到困难怎么办
- 排版约定
- 使用代码示例
- 致谢
- 第 1 章 Python 简介
- 第 2 章 Python 基础
- 第 3 章 供机器读取的数据
- 第 4 章 处理 Excel 文件
- 第 5 章 处理 PDF 文件 以及用 Python 解决问题
- 第 6 章 数据获取与存储
- 第 7 章 数据清洗:研究、匹配与格式化
- 第 8 章 数据清洗:标准化和脚本化
- 第 9 章 数据探索和分析
- 第 10 章 展示数据
- 第 11 章 网页抓取:获取并存储网络数据
- 第 12 章 高级网页抓取:屏幕抓取器与爬虫
- 第 13 章 应用编程接口
- 第 14 章 自动化和规模化
- 第 15 章 结论
- 附录 A 编程语言对比
- 附录 B 初学者的 Python 学习资源
- 附录 C 学习命令行
- 附录 D 高级 Python 设置
- 附录 E Python 陷阱
- 附录 F IPython 指南
- 附录 G 使用亚马逊网络服务
- 关于作者
- 关于封面
第 13 章 应用编程接口
应用编程接口(application programming interface,API)听起来是一个很酷炫的概念,但事实上并不是。API 是在 Web 上共享数据的一种标准方式。许多网站通过 API 端点来共享数据。本书列出了很多可用的 API,但是下面是一些很有用或有趣的 API。
· Twitter(https://dev.twitter.com/overview/api)
· US Census(http://www.census.gov/data/developers/data-sets.html)
· World Bank(http://data.worldbank.org/node/9)
· LinkedIn(https://developer.linkedin.com/docs/rest-api)
· San Francisco Open Data(https://data.sfgov.org/)
这些都是返回数据的 API 示例。你向 API 发出请求,随后 API 返回数据。API 同样可以作为和其他应用交互的一种方式。例如,我们可以使用 Twitter API 来获得 Twitter 的数据,构建另外一个和 Twitter 交互的应用(例如,一个使用 API 发布推文的应用)。Google API 列表(https://developers.google.com/apis-explorer/#p/)是另外一个示例,大多数 API 允许你同公司服务进行交互。使用 LinkedIn API,你可以获取数据,发布更新到 LinkedIn,而不需要通过访问 Web 界面。因为 API 可以做很多不同的事情,所以它应该被认为是一种服务。就我们的目的而言,这个服务提供数据。
在这一章中,你会请求 API 数据并且保存到电脑。API 通常会返回 JSON、XML 或 CSV 文件,这意味着在数据保存到本地计算机之后,你需要应用在本书前几章学到的知识解析这些数据。本章使用的 API 是 Twitter API。
我们出于下面几个原因选择 Twitter API 作为样例。首先,Twiiter 是一个众所周知的平台。其次,Twitter 拥有大量的数据(推文),人们对分析这些数据有很大的兴趣。最后, Twitter API 允许我们探索许多 API 的概念,这正是本章讨论的话题。
Twitter 数据不仅是非正式的信息收集工具,类似于 One Million Tweet Map(http:// onemilliontweetmap.com/),同时也是更正式的学术研究工具,例如用于预测流感趋势(http://ieeexplore.ieee.org/document/5928903/?reload=true&tp=&arnumber=5928903&url=http:%2F%2Fieeexplore.ieee.org%2Fxpls%2Fabs_all.jsp%3Farnumber%3D5928903),以及捕获实时事件的发生,例如地震(http://dl.acm.org/citation.cfm?id=1772777)。
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论