使用每个组的前 n 行对数据框进行子集化,并按变量排序
我想对 n 行数据帧进行子集化,这些行按一个变量分组,并按另一个变量降序排序。通过一个例子就可以清楚地看出这一点: d1 <- data.frame(Gender = …
在 R 中选择 data.table 键
如何为 data.table 对象选择正确的键? 这些注意事项与 RDBMS 的注意事项类似吗?我的第一个猜测是查看一些有关 RDBMS 索引和键的文档。 Google 提出…
data.table 中的子集
我正在尝试对 data.table 进行子集化(来自包 data.table )在 R 中(不是 data.frame)。我有一个 4 位数的年份作为密钥。我想通过一系列的年份来进…
data.table 和字符向量
在我的工作中,我经常将变量列表称为一个字符向量。 A <- data.table(var1 = 1:10, var2 = 11:20, var3 = 21:30) vecvar <- c("var1", "var2", "v…
R 中最快的高宽旋转
我正在处理一个简单的表格,其形式为 date variable value 1970-01-01 V1 0.434 1970-01-01 V2 12.12 1970-01-01 V3 921.1 1970-01-02 V1 -1.10 1970-…
在多个不同的切片上应用聚合函数
我有一个数据数组,其中包含有关人员和项目的一些信息: person_id | project_id | action | time -------------------------------------- 1 | 1 | w…
R:如何在不耗尽内存的情况下重新绑定两个巨大的数据帧
我有两个数据帧 df1 和 df2,每个数据帧大约有 1000 万行和 4 列。我使用 RODBC/sqlQuery 将它们读入 R,没有任何问题,但是当我尝试重新绑定它们时,…
在 R 中合并/连接 data.frames 的最快方法是什么?
例如(但不确定是否最具代表性的例子): N <- 1e6 d1 <- data.frame(x=sample(N,N), y1=rnorm(N)) d2 <- data.frame(x=sample(N,N), y2=rnorm(…
data.table 和“必须评估才能列出”错误
我想使用 R 中的 data.table 包动态生成聚合,但遇到错误。下面,让 my.dt 为 data.table 类型。 sex <- c("M","F","M","F") age <- c(19, 23, 26…
用于按组 ID 子集数据的 for 循环的更高性能替代方案是什么?
我在研究中遇到的一个反复出现的分析范式是需要根据所有不同的组 ID 值进行子集化,依次对每个组进行统计分析,并将结果放入输出矩阵中以供进一步处理…
如何进行data.table合并操作
注意:这个问题和以下答案参考 data.table versions 1.5.3; v. 1.5.3 于 2011 年 2 月发布,旨在解决此问题。 请参阅最近的处理方法 (03-2012):将外…
- 共 1 页
- 1