返回介绍

关于本书

发布于 2024-01-28 22:01:16 字数 627 浏览 0 评论 0 收藏 0

本书涵盖了数据采集、清洗、存储、检索、转换、可视化、高级数据分析(网络分析)、统计和机器学习等内容。本书不是数据科学的综述或参考手册,不过你也能在第1章(“什么是数据科学”)找到如何开展数据科学的简要概述。阅读本书需要的先修知识包括数据科学的相关方法、统计学等。

第2章总结了Python数据结构,字符串、文件和与Web相关的函数,正则表达式,以及列表推导式。总结并非用于讲授这些知识,而是供你温习相关知识点。掌握Python对于一个成功的数据科学家而言无疑是非常重要的,你可以找到许多优秀的图书,进一步学习这门语言。

本书的第一部分介绍了如何使用不同类型的文本数据,包括处理结构化和非结构化的文本,使用NumPy和Pandas模块处理数值数据,以及网络分析。还有三章涉及数据分析的三个方面:使用关系型和非关系型数据库、数据可视化以及简单的预测分析。

本书是一本半叙述半参考性的书。你可以直接按顺序阅读,也可以先找出你关心的函数或概念,然后查阅相关的说明和示例。若是按顺序阅读,而你又有一定的Python编程经验,就可以直接跳过第2章(“数据科学的Python核心”)。如果你不打算使用外部数据库(比如MySQL),也可以忽略第4章(“使用数据库”)。最后,如果你对统计学已经有一定了解,那么完全可以跳过第9章(“概率与统计”)的前两个单元,直接阅读第47单元(“以Python的方式完成统计”)。

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。
列表为空,暂无数据
    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文