返回介绍

6.8 使用简单文件

发布于 2024-01-27 21:43:11 字数 1560 浏览 0 评论 0 收藏 0

如果你的数据集很小,很可能简单文件就可以满足要求,不必使用数据库。你可能想浏览一下第 7 章,在保存之前先用数据清洗技术处理一下,但把数据保存成 CSV 文件或其他简单文件格式是完全可以的。我们用来导入 CSV 的 csv 模块(见 3.1.1 节)也有许多好用的写入类(https://docs.python.org/2/library/csv.html#writer-objects)。

在使用简单文件时,你主要考虑的是确保访问和备份文件都比较方便。要满足这些需求,你可以将数据保存在共享网盘或云服务(Dropbox、Box、Amazon、Google Drive)中。这些服务通常都会提供备份选项和管理能力,同时还能够分享文件。在“哎呀,我把数据文件覆盖了”时,这是非常有用的。

6.8.1 云存储和Python

根据你选择的云存储方案,你应该研究一下用 Python 获取数据的最佳方法。Dropbox 对 Python 的支持很好,网站上的“Python 快速入门指南”(https://www.dropbox.com/developers-v1/core/start/python)很不错。Google Drive 要复杂一些,但“Python 快速上手指南”(https://github.com/googledrive/python-quickstart)可以帮你完成初步的设置。Google Drive 还有一些 Python API 包装器,比如 PyDrive(https://github.com/googledrive/PyDrive),可以让你在不太会用 Python 的情况下使用 Google Drive。要管理 Google Drive 上的电子表格,我们强烈推荐 GSpread(https://github.com/burnash/gspread)。

如果你有自己的云服务器,可能需要研究连接云服务器的最佳方法。Python 有内置的 URL 请求方法、FTP(文件传输协议)方法和 SSH/SCP(Secure Shell/Secure Copy)方法,都包含在 Python 标准库(stdlib)中。在第 14 章中我们还会讲到管理云服务的一些有用库。

6.8.2 本地存储和Python

数据存储最简单也是最直接的方法就是本地存储。用一行 Python 代码就可以打开文件系统中的文档(open 命令,https://docs.python.org/2/library/functions.html#open)。在处理数据时,你还可以用内置的 file.write 方法修改并保存为新文件。

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。
列表为空,暂无数据
    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文