返回介绍

6.10 小结

发布于 2024-01-27 21:43:11 字数 1157 浏览 0 评论 0 收藏 0

恭喜!你已经搞定了项目面临的几个最大问题:我怎么能找到有用的数据?我怎么访问并保存数据?我们希望你对获取的数据源有信心,并相信你第一个数据集的真实性。我们也希望你对数据备份和数据存储有一个可靠的计划。

你可以将本章学习的技术应用到以后的数据集上,即使是在数据网站上花几个小时研究脑海中突然出现的问题。

现在你应该有信心做好以下事情:

· 判断你找到数据集的价值和用途

· 拿起电话寻求更多信息

· 要回答一个问题,知道首先去哪里寻找数据

· 轻松实现安全存储数据的方法

· 核实你找到的数据

· 构建数据的关系模型你还第一次接触到表 6-2 中的这些概念。

表6-2:Python编程新概念和新库

概念/库

作用

关系型数据库(例如 MySQL 和 PostgreSQL)

轻松存储关系型数据

非关系型数据库(例如 MongoDB)

以平面方式存储数据

SQLite(https://www.sqlite.org/)安装和使用

基于 SQL 的易用存储,适用于简单项目

Dataset(https://dataset.readthedocs.org/en/latest/)安装和使用

易用的 Python 数据库包装器

在后续章节中,你还会更多地用到所有这些技术。在下一章里,你将学习清洗数据,利用代码发现异常,编写完整的脚本或程序,这样你就可以分析数据,并输出结果与全世界分享。

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。
列表为空,暂无数据
    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文