学习 R PDF 文档
本书分为上下两部分,旨在指导你如何使用 R,并提供练习的机会。上半部分主要介绍 R 的技术细节和使用技巧。每章都简要介绍了一组不同的数据类型(例如第 4 章介绍向量、矩阵和数组)或概念(例如第 8 章介绍分支和循环)。下半部分更侧重实践,展示了从输入数据到发布结果这一标准的数据分析流程。
即使你没有任何编程基础,也能顺利阅读本书。
R 是一种编程语言,也是用于数据分析和统计的软件环境。它是一个 GNU 项目,这意味着它是自由的开源软件。它正在以指数级的速度不断成长——普遍认为,它的用户人数可能超过了 100 万,它有 4000 多个由开发社区贡献的附件包,而且每年以约 25% 的速度增加。在本书创作之时,它在 Tiobe 编程社区指数(Tiobe Programming Community Index)的开发语言流行榜上已排至第 24 位,大致与 SAS 和 MATLAB 看齐。
R 广泛地应用在每一个需要统计或数据分析的领域,涵盖了金融、市场营销、医药、基因组学、流行病学、社会科学、教学以及许多其他较小的领域。
前言
第一部分 R 语言
第 1 章 简介
1.1 本章目标
1.2 R 是什么
1.3 安装 R
1.4 选择一个 IDE
1.4.1 Emacs+ESS
1.4.2 Eclipse/Architect
1.4.3 RStudio
1.4.4 Revolution-R
1.4.5 Live-R
1.4.6 其他 IDE 和编辑器
1.5 你的第一个程序
1.6 如何从 R 中获得帮助
1.7 安装其他相关软件
1.8 小结
1.9 知识测试:问题
1.10 知识测试:练习
第 2 章 科学计算器
2.1 本章目标
2.2 数学运算符和向量
2.3 变量赋值
2.4 特殊数字
2.5 逻辑向量
2.6 小结
2.7 知识测试:问题
2.8 知识测试:练习
第 3 章 检查变量和工作区
3.1 本章目标
3.2 类
3.3 不同类型的数字
3.4 其他通用类
3.5 检查和更改类
3.6 检查变量
3.7 工作区
3.8 小结
3.9 知识测试:问题
3.10 知识测试:练习
第 4 章 向量、矩阵和数组
4.1 本章目标
4.2 向量
4.2.1 序列
4.2.2 长度
4.2.3 命名
4.2.4 索引向量
4.2.5 向量循环和重复
4.3 矩阵和数组
4.3.1 创建数组和矩阵
4.3.2 行、列和维度
4.3.3 行名、列名和维度名
4.3.4 索引数组
4.3.5 合并矩阵
4.3.6 数组算术
4.4 小结
4.5 知识测试:问题
4.6 知识测试:练习
第 5 章 列表和数据框
5.1 本章目标
5.2 列表
5.2.1 创建列表
5.2.2 原子和递归变量
5.2.3 列表的维度和算术运算
5.2.4 索引列表
5.2.5 向量和列表之间的转换
5.2.6 组合列表
5.3 NULL
5.4 成对列表
5.5 数据框
5.5.1 创建数据框
5.5.2 索引数据框
5.5.3 基本数据框操作
5.6 小结
5.7 知识测试:问题
5.8 知识测试:练习
第 6 章 环境和函数
6.1 本章目标
6.2 环境
6.3 函数
6.3.1 创建和调用函数
6.3.2 向其他函数传递和接收函数
6.3.3 变量的作用域
6.4 小结
6.5 知识测试:问题
6.6 知识测试:练习
第 7 章 字符串和因子
7.1 本章目标
7.2 字符串
7.2.1 创建和打印字符串
7.2.2 格式化数字
7.2.3 特殊字符
7.2.4 更改大小写
7.2.5 截取字符串
7.2.6 分割字符串
7.2.7 文件路径
7.3 因子
7.3.1 创建因子
7.3.2 更改因子水平
7.3.3 去掉因子水平
7.3.4 有序因子
7.3.5 将连续变量转换为类别
7.3.6 将类别变量转换为连续变量
7.3.7 生成因子水平
7.3.8 合并因子
7.4 小结
7.5 知识测试:问题
7.6 知识测试:练习
第 8 章 流程控制和循环
8.1 本章目标
8.2 流程控制
8.2.1 if 和 else
8.2.2 矢量化的 if
8.2.3 多个分支
8.3 循环
8.3.1 重复循环
8.3.2 while 循环
8.3.3 for 循环
8.4 小结
8.5 知识测试:问题
8.6 知识测试:练习
第 9 章 高级循环
9.1 本章目标
9.2 replication
9.3 遍历列表
9.4 遍历数组
9.5 多个输入的应用函数
即时向量化(Instant Vectorization)
9.6 拆分-应用-合并(Split-Apply-Combine)
9.7 plyr 包
9.8 小结
9.9 知识测验:问题
9.10 知识测试:练习
第 10 章 包
10.1 本章目标
10.2 加载包
10.2.1 搜索路径
10.2.2 库和已安装的包
10.3 安装包
10.4 维护包
10.5 小结
10.6 知识测试:问题
10.7 知识测试:练习
第 11 章 日期和时间
11.1 本章目标
11.2 日期和时间类
11.2.1 POSIX 日期和时间
11.2.2 Date 类
11.2.3 其他日期类
11.3 日期与字符串的相互转换
11.3.1 解析日期
11.3.2 格式化日期
11.4 时区
11.5 日期和时间的算术运算
11.6 lubridate
11.7 小结
11.8 知识测试:问题
11.9 知识测试:练习
第二部分 数据分析工作流
第 12 章 获取数据
12.1 本章目标
12.2 内置的数据集
12.3 读取文本文件
12.3.1 CSV 和制表符分隔(Tab-Delimited)文件
12.3.2 非结构化文本文件
12.3.3 XML 和 HTML 文件
12.3.4 JSON 和 YAML 文件
12.4 读取二进制文件
12.4.1 读取 Excel 文件
12.4.2 读取 SAS、Stata、SPSS 和 MATLAB 文件
12.4.3 读取其他文件类型
12.5 Web 数据
12.5.1 拥有 API 的网站
12.5.2 抓取网页
12.6 访问数据库
12.7 小结
12.8 知识测试:问题
12.9 知识测试:练习
第 13 章 数据清理和转换
13.1 本章目标
13.2 清理字符串
13.3 操作数据框
13.3.1 添加和替换列
13.3.2 处理缺失值
13.3.3 在宽和长表格之间进行转换
13.3.4 使用 SQL
13.4 排序
13.5 函数式编程
13.6 小结
13.7 知识测试:问题
13.8 知识测试:练习
第 14 章 探索和可视化
14.1 本章目标
14.2 汇总统计
14.3 三种绘图系统
14.4 散点图
14.4.1 第 1 种方法:base 绘图法
14.4.2 方法 2:lattice 图形系统
14.4.3 方法 3:ggplot2 图形系统
14.4.4 线图
14.5 直方图
14.6 箱线图
14.7 条形图
14.8 其他的绘图包和系统
14.9 小结
14.10 知识测试:问题
14.11 知识测试:练习
第 15 章 分布与建模
15.1 本章目标
15.2 随机数
15.2.1 示例函数
15.2.2 从分布中抽样
15.3 分布
15.4 公式
15.5 第一个模型:线性回归
15.5.1 比较和更新模型
15.5.2 绘图和模型检查
15.6 其他模型类型
15.7 小结
15.8 知识测试:问题
15.9 知识测试:练习
第 16 章 程序设计
16.1 本章目标
16.2 信息、警告和错误
16.3 错误处理
16.4 调试
16.5 测试
16.5.1 RUnit
16.5.2 testthat
16.6 魔法
16.6.1 将字符串转换成代码
16.6.2 把代码转换成字符串
16.7 面向对象编程
16.7.1 S3 类
16.7.2 引用类
16.8 小结
16.9 知识测试:问题
16.10 知识测试:练习
第 17 章 制作程序包
17.1 本章目标
17.2 为什么要创建软件包
17.3 先决条件
17.4 包目录结构
17.5 你的第一个包
17.6 为包撰写文档
17.7 检查和构建包
17.8 包的维护
17.9 小结
17.10 知识测试:问题
17.11 知识测试:练习
第三部分 附录
附录 A 变量的属性
附录 B R 中其他可做的事情
附录 C 问题答案
附录 D 练习答案
下载地址:https://www.wenjiangs.com/wp-content/uploads/2024/05/kbojbMaHdhgFs1Na.zip
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论