文章来源于网络收集而来,版权归原创者所有,如有侵权请及时联系!
关于本书
本书涵盖了数据采集、清洗、存储、检索、转换、可视化、高级数据分析(网络分析)、统计和机器学习等内容。本书不是数据科学的综述或参考手册,不过你也能在第1章(“什么是数据科学”)找到如何开展数据科学的简要概述。阅读本书需要的先修知识包括数据科学的相关方法、统计学等。
第2章总结了Python数据结构,字符串、文件和与Web相关的函数,正则表达式,以及列表推导式。总结并非用于讲授这些知识,而是供你温习相关知识点。掌握Python对于一个成功的数据科学家而言无疑是非常重要的,你可以找到许多优秀的图书,进一步学习这门语言。
本书的第一部分介绍了如何使用不同类型的文本数据,包括处理结构化和非结构化的文本,使用NumPy和Pandas模块处理数值数据,以及网络分析。还有三章涉及数据分析的三个方面:使用关系型和非关系型数据库、数据可视化以及简单的预测分析。
本书是一本半叙述半参考性的书。你可以直接按顺序阅读,也可以先找出你关心的函数或概念,然后查阅相关的说明和示例。若是按顺序阅读,而你又有一定的Python编程经验,就可以直接跳过第2章(“数据科学的Python核心”)。如果你不打算使用外部数据库(比如MySQL),也可以忽略第4章(“使用数据库”)。最后,如果你对统计学已经有一定了解,那么完全可以跳过第9章(“概率与统计”)的前两个单元,直接阅读第47单元(“以Python的方式完成统计”)。
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论