将数值列的 NA 替换为 R 中的数值和字符值
我有一个包含多列的数据框 df。 其中两列( AGE 和 SALARY 列)的类型为 double。 我想用 0 和 替换 AGE 列的缺失值 SALARY 列缺失值“未找到”。 最…
计算数据框中成对有效观察值(无 NA)的数量
假设我有一个像这样的数据框: Df <- data.frame( V1 = c(1,2,3,NA,5), V2 = c(1,2,NA,4,5), V3 = c(NA,2,NA,4,NA) ) 现在我想计算两个变量的每个组合…
删除某一特定列中具有空白值的行
我正在处理一个大型数据集,其中一些行带有 NA,其他行带有空白: df <- data.frame(ID = c(1:7), home_pc = c("","CB4 2DT", "NE5 7TH", "BY5 8IB", …
基础 R 中的箱线图可以显示“NA”吗?当分组因素有缺失值时?
我想要这个: 我认为传递 na.action=na。传递 到 boxplot 会让 NA 显示在 分组名称。这是一些示例代码: #Build a fake dataset set.seed(212012) nn …
报告 data.frame 中缺失值的优雅方法
这是我编写的一小段代码,用于报告数据框中缺少值的变量。我正在尝试想出一种更优雅的方法来做到这一点,一种可能返回 data.frame 的方法,但我陷入了…
如何使用 R 使用地理邻近度来填充缺失的分类值?
我有一些如下所示的数据: ID lat long university date cat2 cat3 cat4 ... 00001 32.001 -64.001 MIT 2011-07-01 xyz foo NA ... 00002 45.783 67.6…
OLAP/MDX 是处理各种聚合级别的未知值数据的好方法吗
我是 OLAP 新手,所以也许我不知道解决这个问题的正确术语,但请耐心听我说。 我处理大量分层、多维数据,其中父/聚合单元格大多具有数据,但子/叶单…
将 R 中选定列中的所有 NA 替换为 FALSE
我有一个类似于这个的问题,但我的数据集是更大一些:50 列,其中 1 列作为 UID,其他列带有 TRUE 或 NA,我想将所有 NA 更改为 假,但是我不想使用显…
重新编码丢失的数据 Numpy
我正在使用 matplotlib cvs2rec 函数读取人口普查数据 - 工作正常,给了我一个很好的 ndarray 。 但是有几列的所有值都是 dtype |04 的“none”。当我…
在 R 中预测/估算泊松 GLM 回归的缺失值?
我正在尝试探索在数据集中填补缺失值的方法。我的数据集包含年份(2001-2009)、月份(1-12)、性别(男/女)和年龄组(4 组)的发生次数(非自然、自…