统计思维:程序员数学之概率统计 第2版 PDF 文档
通过一个案例研究,介绍探索性数据分析的全过程:从收集数据、生成统计信息,到发现模式、验证假设。同时研究分布、概率规则、可视化和其他多种工具及概念。此外,第 2 版新增了回归、时间序列分析、生存分析和分析方法等章节。
目录
前言
第 1 章 探索性数据分析
1.1 统计学方法
1.2 全国家庭增长调查
1.3 数据导入
1.4 DataFrame
1.5 变量
1.6 数据变换
1.7 数据验证
1.8 解释数据
1.9 练习
1.10 术语
第 2 章 分布
2.1 表示直方图
2.2 绘制直方图
2.3 全国家庭增长调查中的变量
2.4 离群值
2.5 第一胎
2.6 分布概述
2.7 方差
2.8 效应量
2.9 报告结果
2.10 练习
2.11 术语
第 3 章 概率质量函数
3.1 概率质量函数
3.2 绘制 PMF
3.3 绘制 PMF 的其他方法
3.4 课堂规模悖论
3.5 使用 DataFrame 进行索引
3.6 练习
3.7 术语
第 4 章 累积分布函数
4.1 PMF 的局限
4.2 百分位数
4.3 CDF
4.4 表示 CDF
4.5 比较 CDF
4.6 基于百分位数的统计量
4.7 随机数
4.8 比较百分位秩
4.9 练习
4.10 术语
第 5 章 分布建模
5.1 指数分布
5.2 正态分布
5.3 正态概率图
5.4 对数正态分布
5.5 Pareto 分布
5.6 随机数生成
5.7 为什么使用模型
5.8 练习
5.9 术语
第 6 章 概率密度函
6.1 PDF
6.2 核密度估计
6.3 分布框架
6.4 Hist 实现
6.5 Pmf 实现
6.6 Cdf 实现
6.7 矩
6.8 偏度
6.9 练习
6.10 术语
第 7 章 变量之间的关系
7.1 散点图
7.2 描述关系特征
7.3 相关性
7.4 协方差
7.5 Pearson 相关性
7.6 非线性关系
7.7 Spearman 秩相关
7.8 相关性和因果关系
7.9 练习
7.10 术语
第 8 章 估计
8.1 估计游戏
8.2 猜测方差
8.3 抽样分布
8.4 抽样偏倚
8.5 指数分布
8.6 练习
8.7 术语
第 9 章 假设检验
9.1 经典假设检验
9.2 假设检验
9.3 检验均值差
9.4 其他检验统计量
9.5 检验相关性
9.6 检验比例
9.7 卡方检验
9.8 再谈第一胎
9.9 误差
9.10 功效
9.11 复现
9.12 练习
9.13 术语
第 10 章 线性最小二乘法
10.1 最小二乘法拟合
10.2 实现
10.3 残差
10.4 估计
10.5 拟合优度
10.6 检验线性模型
10.7 加权重抽样
10.8 练习
10.9 术语
第 11 章 回归
11.1 StatsModels
11.2 多重回归
11.3 非线性关系
11.4 数据挖掘
11.5 预测
11.6 Logistic 回归
11.7 估计参数
11.8 实现
11.9 准确度
11.10 练习
11.11 术语
第 12 章 时间序列分析
12.1 导入和清洗数据
12.2 绘制图形
12.3 线性回归
12.4 移动平均值
12.5 缺失值
12.6 序列相关
12.7 自相关
12.8 预测
12.9 参考书目
12.10 练习
12.11 术语
第 13 章 生存分析
13.1 生存曲线
13.2 危险函数
13.3 估计生存曲线
13.4 Kaplan-Meier 估计
13.5 婚姻曲线
13.6 估计生存函数
13.7 置信区间
13.8 群组效应
13.9 外推
13.10 预期剩余生存期
13.11 练习
13.12 术语
第 14 章 分析方法
14.1 正态分布
14.2 抽样分布
14.3 表示正态分布
14.4 中心极限定理
14.5 检验 CLT
14.6 应用 CLT
14.7 相关检验
14.8 卡方检验
14.9 讨论
14.10 练习
下载地址:https://www.wenjiangs.com/wp-content/uploads/2024/05/d4wH3fV8FzysLdMe.zip
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
上一篇: 用户力 PDF 文档
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论