使用 ddply 分配组 ID
R 新手提出的非常基本的性能问题。我想通过唯一的字段组合为数据框中的每一行分配一个组 ID。这是我当前的方法: > # An example data frame > df…
ddply 在函数中运行会查看函数外部的环境吗?
我正在尝试编写一个函数来进行一些经常重复的分析,其中一部分是计算组数和每个组内的成员数,因此 ddply 可以拯救!但是,我的代码有问题。 ... 这是…
按因子值将数据帧分成子集,发送到返回 glm 类的函数,如何重新组合?
感谢 Hadley 的 plyr 包 ddply 函数,我们可以获取一个数据帧,按因子将其分解为子数据帧,将每个子数据帧发送到一个函数,然后将每个子数据帧的函数…
从 data.frame 命令中的列表指定列名称
我有一个名为 cols 的列表,其中包含列名称: cols <- c('Column1','Column2','Column3') 我想重现这个命令,但调用列表: data.frame(Column1=rnor…
如何更好地从 ggplot2 创建具有多个变量的堆叠条形图?
我经常需要制作堆叠条形图来比较变量,并且因为我在 R 中完成所有统计,所以我更喜欢使用 ggplot2 在 R 中完成所有图形。我想学习如何做两件事: 首先…
如何使用 plyr 对行进行编号?
基本上我想要一个基于我的群组的自动增量 id 列 - 在这种情况下。(kmer,cvCut) > myDataFrame size kmer cvCut cumsum 1 8132 23 10 8132 10000 …
我可以在 ddply() 中进行保证金计算吗?
cast() 函数非常适合计算聚合值的边距: cast(df, IDx1+IDx2~IDy1, margins=c('IDx1','IDx2','grand_row') ,c(min,mean,max)) 问题是我需要使用第二个…
使用 plyr 对 df 进行多重变换
我有一个 df,我想用 plyr: idplot / idtree / species / condition / dbh_cm / h_m / hblc_m CalcG <- function (df) transform(df, g_m2 = pi * (…
从绝对数到二级数据中的比例(R!SAC?plyr?)
我将数据嵌套在各个级别中: L1 L2 x1 x2 x3 x4 A This 20 14 12 15 A That 11 NA 8 16 A Bat Na 22 13 9 B This 10 9 11 6 B That 3 3 1 NA B Bat 4 …
对于每个组,总结数据框中所有变量的平均值(ddply?split?)
一周前,我会手动完成此操作:按组将数据帧子集到新数据帧。对于每个数据帧计算每个变量的平均值,然后进行 rbind。非常笨重... 现在我已经了解了 spl…
使用 R 中的 plyr 包重命名输出列
Hadley 让我接触了 plyr 包,我发现自己一直在使用它来进行“分组” '之类的东西。但我发现自己必须始终重命名结果列,因为它们默认为 V1、V2 等。 这…