如何回顾一个字符串值,该值的字符串值在内部?
我在尝试重新解码变量时使用了DPLYR软件包和函数进行了回顾,因为原始作者有许多错别字。例如,我已经设法执行“ RKS(umik)” =“ rks”或“ Cu” =…
重新编码日期是否大于?
我有几个日期,所有发生在2005-06-12之后的事情都应重新编码为2005-06-12 # Example how the data looks like: data <- data.frame(review_date = as.…
在R中创建一个具有独家条件的变量
我的数据看起来像这样 Q3A1<-c(0,1,0,1,1,1,0,1,0,1) Q3A2<-c(0,1,1,1,0,1,0,0,0,1) Q3A3<-c(1,1,0,1,0,1,0,0,0,1) ,我想创建一个新的变量Q3L,如果…
如何根据R中另一列的特定值正确更改级别值?
我想根据同一列的特定值和另一列的特定值更改/重新编码列的级别。例如,让我们使用ggplot2 ::钻石。在这种情况下,我想在 剪切 列中更改“ premium”…
在R中重新编码复杂的综合评分
假设我的研究涉及一项观察性纵向队列研究。 令γ_comp成为感兴趣的综合结果, γ1 ....γ4 at time t1 和 t2 表示γ_comp的组件。此外,数据集还有其…
如何使用不均匀的间隔标准化间隔变量的单位更改?
我正在R中构建OLS模型,并且遇到了一个方法论问题。该研究的主要独立变量是“城镇规模”,该变量已编码(在代码书中)为: 1.- 2,000以下 2.- 2,000-5…
基于不同数据帧中的值重新编码第二数据帧中的值
我想根据不同数据框中的相应值在第二个数据框中重新编码值。 例如,这是第一个数据框架的样子。每个代码都分配给相应的区域。 区域 代码 1 12345 2 23…
是否有一种简单的方法来重新编码因子变量的水平,使得低于给定频率出现的水平被重新编码为“其他”变量?
theshold <- c(0.001, 0.5, 0.1) df$a df$b df$c - 基于小于第一个阈值的级别频率重新编码级别 df$x df$y df$x - 基于小于第一个阈值的级别频率重新编…
跨多列使用和/或条件重新编码
我想创建一个新变量 (new_var) 并根据多个列对其进行条件限制: class == "yes" &分数1:分数5>80。我有可以在下面运行的代码,但是有没有更干净的方法…
如何重新编码新的日期变量并从 R 中的四个日期列中选择最低的日期
示例数据 stack_dat <- structure(list(bio_drug_stop_date = structure(c(15376, NA, 15602, NA, 15550, NA, 15350, 15363, 15418, 16157), class = …
在 R 中的 mouse 库的 mids 对象中重新编码变量
以下数据集可用 data <- structure(list(asdas_6month = c(23.1222666868239, 25.4056847196073, 25.9886630231065, NA, 26.9450864282904, 15.183295…