文章来源于网络收集而来,版权归原创者所有,如有侵权请及时联系!
第 4 章 使用数据库
你学习(或实践)了数据科学,也掌握了如何将磁盘文件中的原始数据以Python数据结构导入。让我们趁热打铁,开启数据科学的另一个主题——数据库——一个用于长期存储数据的工具。
数据库是整个数据分析过程中的重要组成部分。
通常,输入数据是以数据库表的形式提供的。为实现进一步的处理,必须从数据库中将数据检索出来。
数据库能实现高度优化、快速且非易失性的数据存储,可用于存储原始数据、中间结果和最终结果(无论原始数据是否存储在数据库中)。
数据库提供高度优化的数据转换,包括排序、选择和连接功能。如果数据库中已经存在原始数据或中间结果,则还可以实现数据聚合。
本章将结合MySQL和MongoDB(或NoSQL数据库)——当前最流行的关系数据库之一和最流行的文档存储——探索如何设置、配置、填充和查询数据。你很可能已经知道怎么将这些数据库作为预配置和预填充的数据源了,但进一步了解数据库引擎丰富的内部世界依然是有益的。它不仅能使你成为一名更优秀的程序员,也能为学习后续章节中的pandas模块(第6章)奠定坚实的基础。
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论