返回介绍

第 4 章 使用数据库

发布于 2024-01-28 22:01:16 字数 505 浏览 0 评论 0 收藏 0

你学习(或实践)了数据科学,也掌握了如何将磁盘文件中的原始数据以Python数据结构导入。让我们趁热打铁,开启数据科学的另一个主题——数据库——一个用于长期存储数据的工具。

数据库是整个数据分析过程中的重要组成部分。

通常,输入数据是以数据库表的形式提供的。为实现进一步的处理,必须从数据库中将数据检索出来。

数据库能实现高度优化、快速且非易失性的数据存储,可用于存储原始数据、中间结果和最终结果(无论原始数据是否存储在数据库中)。

数据库提供高度优化的数据转换,包括排序、选择和连接功能。如果数据库中已经存在原始数据或中间结果,则还可以实现数据聚合。

本章将结合MySQL和MongoDB(或NoSQL数据库)——当前最流行的关系数据库之一和最流行的文档存储——探索如何设置、配置、填充和查询数据。你很可能已经知道怎么将这些数据库作为预配置和预填充的数据源了,但进一步了解数据库引擎丰富的内部世界依然是有益的。它不仅能使你成为一名更优秀的程序员,也能为学习后续章节中的pandas模块(第6章)奠定坚实的基础。

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。
列表为空,暂无数据
    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文