如何加快summary和ddply的速度?
我有一个包含 200 万行和 15 列的数据框。我想用 ddply 对其中 3 列进行分组(所有 3 列都是因子,这些因子有 780,000 个独特的组合),并获得 3 列的…
从 lmList 对象中提取 RMSE
我有以下代码从 lmList 对象中提取系数。 library(lme4) library(plyr) lm.model <- lmList(Y ~ X | eventID, df) param <- ldply(lm.model, coef…
如果我的分组变量是一个因素,如何生成按组汇总统计数据?
假设我想获取数据集 mtcars(基础 R 版本 2.12.1 的一部分)的一些汇总统计数据。 下面,我根据汽车所拥有的发动机气缸数对汽车进行分组,并采用 mtca…
关于 sapply /plyr 语法的 R 问题:如何将变量值传递给函数
有没有办法将 ddply/sapply 中的变量值直接传递给函数而不使用函数 (x) 表示法? 例如,而不是: ddply(bu,.(Trial), function (x) print(x$tangle) )…
R:在 data.frame 列中拆分不平衡列表
假设您有一个具有以下结构的数据框: df <- data.frame(a=c(1,2,3,4), b=c("job1job2", "job1a", "job4job5job6", "job9job10job11")) 其中列 b 是…
开始使用 plyr `m*ply` 但无法重现示例
尝试学习 plyr,我在尝试从 介绍性指南< 中重现代码时遇到了困难/a>. 该指南说代码位于文件 plyr.r 中,但我在哪里可以找到该文件。 但复制第一个…
我如何重写这段代码,以便它按预期使用 plyr/ddply?
背景 我有一个概率分布数据框,我想计算其统计摘要: priors <- structure(list(name = c("theta1", "theta2", "theta3", "theta4", "theta5"), dis…
plyr summarise 只调用全局函数
我正在尝试将函数(weight.func)传递给调用 ddply 的不同函数(包装器)。我希望 ddply 使用该函数(weight.func)作为其计算的一部分。当weight.fun…
关于 Plyr 错误的问题:as.double(y) 中的错误:无法强制类型“S4”;到“double”类型的向量
我正在升级我之前工作的一个项目。这段代码几个月前就有效了,同时我升级了 R 和 plyr。我想我以前使用的是 R1.10,现在使用的是 R1.35,我不确定之前…
使用 R 处理入院数据(第二部分)
感谢大家就使用 R 处理入院数据,我对这个问题还有补充问题,其实应该是这个问题之前的任务。 现在我有一个像这样的数据集: Patient_ID Date Ward P0…
R中的plyr在合并过程中非常慢
我在 R 中使用 plyr 包执行以下操作: 根据 A 列和 B 列从表 A 中选取一行, 查找表 B 中 A 列和 B 列中具有相同值的行, 将 C 列从表 B 复制到表A 我…
如何加速这个 R 代码
我有一个 data.frame(文件链接)有 18 列和 11520 行,我像这样转换: library(plyr) df.median<-ddply(data, .(groupname,starttime,fPhase,fCycl…