Python 数据分析基础 PDF 文档

发布于 2024-03-24 11:02:24 字数 3551 浏览 20 评论 0

本书展示如何用 Python 程序将不同格式的数据处理和分析任务规模化和自动化。主要内容包括 :Python 基础知识介绍、CSV 文件和 Excel 文件读写、数据库的操作、示例程序演示、图表的创建,等等。

本书适合数据分析与处理工作相关人员。

本书面向的读者是那些经常使用电子表格软件进行数据处理,但从未写过一行代码的人。前几章会教你设置 Python 运行环境,告诉你计算机是如何看待数据并对其进行简单处理的。你很快就能掌握在电子表格(包括 CSV 文件)和数据库中处理数据的方法。

刚开始,你可能会觉得这样做是一种退步,如果你能熟练使用 Excel,这种感受会更加强烈。以前你只需复制粘贴就能完成的工作,现在却要煞费苦心地告诉 Python 如何在列的每个单元格之间循环,这效率太低了,想想就令人沮丧(特别是当你几次三番地回头去找某一处输入错误的时候)。但是当你逐渐掌握了 Python 之后,就会不断地发现它的真正价值所在,而其中一个极好的例子就是它可以自动完成你现在不断重复的工作。

前言
第 1 章 Python 基础
1.1 创建 Python 脚本
1.2 运行 Python 脚本
1.3 与命令行进行交互的几项技巧
1.4 Python 语言基础要素
1.4.1 数值
1.4.2 字符串
1.4.3 正则表达式与模式匹配
1.4.4 日期
1.4.5 列表
1.4.6 元组
1.4.7 字典
1.4.8 控制流
1.5 读取文本文件
1.5.1 创建文本文件
1.5.2 脚本和输入文件在同一位置
1.5.3 读取文件的新型语法
1.6 使用 glob 读取多个文本文件
创建另一个文本文件
1.7 写入文本文件
1.7.1 向 first_script.py 添加代码
1.7.2 写入 CSV 文件
1.8 print 语句
1.9 本章练习
第 2 章 CSV 文件
2.1 基础 Python 与 pandas
2.1.1 读写 CSV 文件(第 1 部分)
2.1.2 基本字符串分析是如何失败的
2.1.3 读写 CSV 文件(第 2 部分)
2.2 筛选特定的行
2.2.1 行中的值满足某个条件
2.2.2 行中的值属于某个集合
2.2.3 行中的值匹配于某个模式/正则表达式
2.3 选取特定的列
2.3.1 列索引值
2.3.2 列标题
2.4 选取连续的行
2.5 添加标题行
2.6 读取多个 CSV 文件
文件计数与文件中的行列计数
2.7 从多个文件中连接数据
2.8 计算每个文件中值的总和与均值
2.9 本章练习
第 3 章 Excel 文件
3.1 内省 Excel 工作簿
3.2 处理单个工作表
3.2.1 读写 Excel 文件
3.2.2 筛选特定行
3.2.3 选取特定列
3.3 读取工作簿中的所有工作表
3.3.1 在所有工作表中筛选特定行
3.3.2 在所有工作表中选取特定列
3.4 在 Excel 工作簿中读取一组工作表
在一组工作表中筛选特定行
3.5 处理多个工作簿
3.5.1 工作表计数以及每个工作表中的行列计数
3.5.2 从多个工作簿中连接数据
3.5.3 为每个工作簿和工作表计算总数和均值
3.6 本章练习
第 4 章 数据库
4.1 Python 内置的 sqlite3 模块
4.1.1 向表中插入新记录
4.1.2 更新表中记录
4.2 MySQL 数据库
4.2.1 向表中插入新记录
4.2.2 查询一个表并将输出写入 CSV 文件
4.2.3 更新表中记录
4.3 本章练习
第 5 章 应用程序
5.1 在一个大文件集合中查找一组项目
5.2 为 CSV 文件中数据的任意数目分类计算统计量
5.3 为文本文件中数据的任意数目分类计算统计量
5.4 本章练习
第 6 章 图与图表
6.1 matplotlib
6.1.1 条形图
6.1.2 直方图
6.1.3 折线图
6.1.4 散点图
6.1.5 箱线图
6.2 pandas
6.3 ggplot
6.4 seaborn
第 7 章 描述性统计与建模
7.1 数据集
7.1.1 葡萄酒质量
7.1.2 客户流失
7.2 葡萄酒质量
7.2.1 描述性统计
7.2.2 分组、直方图与 t 检验
7.2.3 成对变量之间的关系和相关性
7.2.4 使用最小二乘估计进行线性回归
7.2.5 系数解释
7.2.6 自变量标准化
7.2.7 预测
7.3 客户流失
7.3.1 逻辑斯蒂回归
7.3.2 系数解释
7.3.3 预测
第 8 章 按计划自动运行脚本
8.1 任务计划程序(Windows 系统)
8.2 cron 工具(macOS 系统和 Unix 系统)
8.2.1 cron 表文件:一次性设置
8.2.2 向 cron 表文件中添加 cron 任务
第 9 章 从这里启航
9.1 更多的标准库模块和内置函数
9.1.1 Python 标准库(PSL):更多的标准模块
9.1.2 内置函数
9.2 Python 包索引(PyPI):更多的扩展模块
9.2.1 NumPy
9.2.2 SciPy
9.2.3 Scikit-Learn
9.2.4 更多的扩展包
9.3 更多的数据结构
9.3.1 栈
9.3.2 队列
9.3.3 图
9.3.4 树
9.4 从这里启航
附录 A 下载指南
A.1 下载 Python 3
A.1.1 Windows
A.1.2 macOS
A.2 下载 xlrd 扩展包
A.2.1 Windows
A.2.2 macOS
A.3 下载 MySQL 数据库服务器
A.3.1 Windows
A.3.2 macOS
A.3.3 启动 MySQL
A.4 下载 mysqlclient(Python 3.x)/MySQL-python(Python 2.x)
A.4.1 Windows
A.4.2 macOS
附录 B 练习答案
第 1 章
练习 1
练习 2
练习 3
作者介绍
封面介绍
延展阅读

下载地址:https://www.wenjiangs.com/wp-content/uploads/2024/01/4arxiEYK2RbVjJgf.zip

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。
列表为空,暂无数据

关于作者

JSmiles

生命进入颠沛而奔忙的本质状态,并将以不断告别和相遇的陈旧方式继续下去。

文章
评论
84962 人气
更多

推荐作者

qq_oxT0yE

文章 0 评论 0

hls.

文章 0 评论 0

坤阳

文章 0 评论 0

怪兽饲养员Y

文章 0 评论 0

TALE

文章 0 评论 0

花心好男孩

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文