返回介绍

3.4 小结

发布于 2024-01-27 21:43:11 字数 3012 浏览 0 评论 0 收藏 0

能够用 Python 处理机器可读的数据格式,这是数据处理的必备技能之一。本章讲了 CSV、 JSON 和 XML 三种文件类型。表 3-2 给出了在处理 WHO 数据的不同文件格式时所用到的 Python 库。

表3-2:文件类型和文件扩展名

文件类型

文件扩展名

Python 库

CSV、TSV

.csv、.tsv

csv 库(https://docs.python.org/2/library/csv.html

JSON

.json、.js

json 库(https://docs.python.org/2/library/json.html

我们还讲了一些新的 Python 概念。现在你应该知道如何在 Python 解释器中运行 Python 代码,以及如何将代码保存到新文件,并在命令行中运行。我们还学习了用 import 导入文件,以及用 Python 的 read 和 open 打开本地文件并读取。

我们讲的编程新概念还包括用 for 循环遍历文件、列表或树,还有用 if-else 语句判断特定条件是否满足,然后据此执行对应的命令。表 3-3 对本章学过的新函数和代码逻辑做了总结。

表3-3:Python编程的新概念

概念

作用

import(https://docs.python.org/2/reference/simple_stmts.html#import

向 Python 中导入模块

open(https://docs.python.org/2/library/functions.html#open

内置函数,用 Python 打开本地文件

for 循环(http://anh.cs.luc.edu/python/hands-on/3.1/handsonHtml/loops.html#basic-for-loops

一段代码,运行 n

if-else 语句(http://anh.cs.luc.edu/python/hands-on/3.1/handsonHtml/ifstatements.html#simple-if-statements

如果满足特定条件,运行一段代码

==(等于运算符,https://docs.python.org/2/reference/expressions.html#not-in

检验两个值是否相等

序列索引(https://docs.python.org/2/library/stdtypes.html#sequence-types-str-unicode-list-tuple-bytearray-buffer-xrange

取出序列(字符串、列表等)中第 n 个对象

最后,我们在本章创建并保存了许多代码文件和数据文件。假如你完成了本章的所有练习,应该有三个代码文件和三个数据文件。本章前面推荐过组织代码的方法。如果你还没有照做的话,现在马上去做。这是目前所有文件的组织结构示例:

data_wrangling/
  code/
    ch3_easy_data/
      import_csv_data.py
      import_xml_data.py
      import_json_data.py
      data-text.csv
      data-text.xml
      data-json.json
    ch4_hard_data/
      ...

接下来,我们要学习更复杂的数据格式!

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。
列表为空,暂无数据
    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文