返回介绍

第 2 章 数据科学的 Python 核心

发布于 2024-01-28 22:01:16 字数 547 浏览 0 评论 0 收藏 0

Python核心的一些特性对于数据分析而言至关重要。本章将给出最为重要的特性:字符串函数、数据结构、列表推导式、计数器、文件和Web函数、正则表达式、globbing以及pickling数据。通过学习本章,你将掌握如何使用Python从本地磁盘文件和网络中提取数据,用恰当的数据结构存储数据,定位与给定模式相匹配的位和片段,以及为方便后续处理而对Python对象进行序列化和反序列化操作。这些功能并非数据科学或数据分析任务所特有的,在许多其他应用中也会用到。

人们往往错误地认为,高级编程工具的出现使得低级编程过时了。毕竟独立于Python的Anaconda发行版就提供了350多个Python包,谁会需要自己去实现拆分字符串和打开文件这样低级的函数呢?但是不可否认,世界上依然存在大量非标准的数据源,处理这些数据就必须编写低级的函数。

所有的标准数据frame、series、CSV读取器和文字分词器,都遵循其创建者设定的规则。一旦遇到任何违反规则的情况,这些工具都将束手无策。此时,你就应该摘去数据科学家的光环,吹去这本书上的灰尘,做回一个谦卑而务实的程序员。

为了接点“地气”,你可能需要了解字符串函数——相关的内容就在第4单元中。

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。
列表为空,暂无数据
    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文