missing-data

missing-data

文章 0 浏览 5

将数值列的 NA 替换为 R 中的数值和字符值

我有一个包含多列的数据框 df。 其中两列( AGE 和 SALARY 列)的类型为 double。 我想用 0 和 替换 AGE 列的缺失值 SALARY 列缺失值“未找到”。 最…

明月松间行 2025-01-09 12:00:12 3 0

创建一个函数来识别缺失值

我正在尝试构建一个函数作为 R 中更大函数的一部分。有些部分工作正常,但其他部分则不然。这是给我带来问题的代码片段。 这部分函数旨在识别数据框中…

梦里南柯 2025-01-09 10:10:25 2 0

R 中 ggplot 中的组线图中缺少线段

我使用 ggplot 在 R 中按组创建了累积和的线图。我的问题是有些行包含缺失的段——要么在行的开头、行的末尾,要么在行的中间。 我该如何解决这个问题…

笑咖 2025-01-09 09:06:36 3 0

计算数据框中成对有效观察值(无 NA)的数量

假设我有一个像这样的数据框: Df <- data.frame( V1 = c(1,2,3,NA,5), V2 = c(1,2,NA,4,5), V3 = c(NA,2,NA,4,NA) ) 现在我想计算两个变量的每个组合…

黯然#的苍凉 2025-01-08 15:13:46 2 0

sciits 机器学习中的缺失值

scikit-learn 中是否可能存在缺失值?他们应该如何代表?我找不到任何相关文档。…

メ斷腸人バ 2025-01-07 22:46:46 3 0

删除某一特定列中具有空白值的行

我正在处理一个大型数据集,其中一些行带有 NA,其他行带有空白: df <- data.frame(ID = c(1:7), home_pc = c("","CB4 2DT", "NE5 7TH", "BY5 8IB", …

情丝乱 2025-01-02 21:23:05 1 0

基础 R 中的箱线图可以显示“NA”吗?当分组因素有缺失值时?

我想要这个: 我认为传递 na.action=na。传递 到 boxplot 会让 NA 显示在 分组名称。这是一些示例代码: #Build a fake dataset set.seed(212012) nn …

情痴 2025-01-01 06:44:50 2 0

报告 data.frame 中缺失值的优雅方法

这是我编写的一小段代码,用于报告数据框中缺少值的变量。我正在尝试想出一种更优雅的方法来做到这一点,一种可能返回 data.frame 的方法,但我陷入了…

就是爱搞怪 2024-12-18 18:37:01 5 0

Haskell 中稀疏缺失数据的高效处理

我正在尝试使用 Haskell 进行数据分析。由于我的数据集相当大(数十万甚至可能数百万个观测值),因此我理想情况下希望使用未装箱的数据结构来提高效…

世界如花海般美丽 2024-12-15 12:03:11 6 0

如何使用 R 使用地理邻近度来填充缺失的分类值?

我有一些如下所示的数据: ID lat long university date cat2 cat3 cat4 ... 00001 32.001 -64.001 MIT 2011-07-01 xyz foo NA ... 00002 45.783 67.6…

情定在深秋 2024-12-14 17:50:30 7 0

替换 R 中缺失值的均值或众数

我有一个由混合数据类型(数字、 字符、因子、序数因子)缺少值,而我是 尝试创建一个 for 循环来替换缺失的值 如果是数值,则使用相应列的平均值;如…

近箐 2024-12-09 07:35:06 3 0

OLAP/MDX 是处理各种聚合级别的未知值数据的好方法吗

我是 OLAP 新手,所以也许我不知道解决这个问题的正确术语,但请耐心听我说。 我处理大量分层、多维数据,其中父/聚合单元格大多具有数据,但子/叶单…

手心的海 2024-12-04 05:18:30 9 0

将 R 中选定列中的所有 NA 替换为 FALSE

我有一个类似于这个的问题,但我的数据集是更大一些:50 列,其中 1 列作为 UID,其他列带有 TRUE 或 NA,我想将所有 NA 更改为 假,但是我不想使用显…

陌路黄昏 2024-12-02 08:37:37 10 0

重新编码丢失的数据 Numpy

我正在使用 matplotlib cvs2rec 函数读取人口普查数据 - 工作正常,给了我一个很好的 ndarray 。 但是有几列的所有值都是 dtype |04 的“none”。当我…

是你 2024-11-29 06:26:03 6 0

在 R 中预测/估算泊松 GLM 回归的缺失值?

我正在尝试探索在数据集中填补缺失值的方法。我的数据集包含年份(2001-2009)、月份(1-12)、性别(男/女)和年龄组(4 组)的发生次数(非自然、自…

白芷 2024-11-27 11:54:07 9 0
更多

推荐作者

882123719

文章 0 评论 0

朦胧时间

文章 0 评论 0

眼藏柔

文章 0 评论 0

微信用户

文章 0 评论 0

寻梦旅人

文章 0 评论 0

更多

友情链接

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文