missing-data

missing-data

文章 0 浏览 5

如何在分类数据中填充缺失值?

我有一个由20000名员工组成的数据集,该数据集以下有三列缺少价值的列: 通过大学 专业 的大学名称 ,现在我有10000名员工从未上过大学。我的最终目标…

何时共饮酒 2025-02-05 02:00:33 4 0

在数据框中的所有列中找到唯一值的计数,而不包括NA值(R)

给定可重现的数据框,我想在每列中找到不包括缺失(NA)值的唯一值数。下面的代码计数Na值,因此, nat_country 列的基数显示为 n_unique_values data…

守护在此方 2025-02-04 21:46:34 5 0

为什么dplyr colesce(。)和填充(。)不起作用而仍然留下缺失的值?

我有一个简单的测试数据集,该数据集为参与者有许多重复行。我希望每个参与者没有NAS一排,除非参与者拥有整列的NAS。我尝试按参与者名称进行分组,然…

巷雨优美回忆 2025-02-04 05:20:32 3 0

knnimputer正在用无效替换数据

我正在研究一个具有敏感数据的项目,并偶然发现了这个“错误”(可能是我脑海中的东西)。最近,我从Sklearn中学到了Knnimputer,我喜欢它的概念。 但…

宣告ˉ结束 2025-02-04 03:56:38 4 0

KNN螺母插入Sklearn

我想使用类 sklearn.impute.knnimputer 在我的数据集中估算缺失值。 我有两个问题: 我在媒体上看到了多个实现,也是官方Sklearn 网站。它们都不将数…

梦里梦着梦中梦 2025-02-03 19:14:31 5 0

仅在上一个有效值和下一个有效值的平均值中仅填充熊猫中连续的nan中的最后一个

仅在上一个有效值和下一个有效值的平均值中,仅在熊猫中连续的NAN中填写最后一个。如果一个nan,请填充下一个和上一个的平均值。如果连续两个NAN,则…

苍风燃霜 2025-02-03 17:31:37 4 0

如何用SQL中类别的平均值替换为空值?

列 具有 值 无效 在 一个 中 数据 有 我 的 集 ​ ​ ​ ​ ​ ​-01 42737 747 60 2021-07-03 42736 748 30 60.0 2021-07-07-03 42735 747 15 42.62 …

海的爱人是光 2025-02-03 06:34:33 2 0

回填和前填充Nans和Zeros

我正在尝试回到/前进,以填补员工的工作经验(年)。我要实现的目标是: 员工200 2019 - 3年,2018年 - 2年,2017年 - 1年 员工300 keep as Nan Emplo…

无妨# 2025-02-01 15:54:26 2 0

无法安装Missforest软件包?

我想安装“ Missforest”软件包来处理缺少的数据。但是我无法成功安装它。 install.packages(“ Missforest”) install.packages中的警告: 依赖性…

固执像三岁 2025-02-01 01:28:41 2 0

计算2列之一中存在空白的实例数+ r

我需要测试一个数据框以完成记录 - 要完成记录,必须在两个列中进行条目。在示例 df 中,您将看到9个条目中的2个中包含一个行中的空白。 df <- data.f…

风渺 2025-02-01 00:28:39 4 0

如果列的列有一个值,则如何用列中的CERO替换Na?使用r

我想知道一种替换列的NA的方法,如果列的列有一个值意味着应该用CERO替换,如果列周围的列中没有值,则意味着他那天没有上班,而NA是正确的, 我一直…

∞觅青森が 2025-01-30 12:29:11 5 0

新R的小鼠包装速度较慢R 10倍

我最近更新了我的 r (从4.0到4.2),现在 MICE()运行 在相同的数据上慢慢。这发生在其他人身上吗? 也许我的 .renviron 被重置了,类似 r_max_vsiz…

七度光 2025-01-30 08:34:07 5 0

如何使用package promutets的gplot_na_imputations()或ggplot_na_distribution()

我有一个数据框架(在2020年至2022年之间,有100行/国家/国家/地区的表格和28列/月)。我使用了软件包螺旋体,并使用函数na_kalman()用一些估计值代…

爱冒险 2025-01-30 07:34:26 2 0

为什么如果(Julia)不能将基因矢量的一个要素测试为条件评估?

我想创建一个函数,首先,它过滤了朱莉娅(Julia)中数据框的一个元素。其次,它测试元素是否“丢失”。如果答案是rue,它将返回值“ 0.0”。我的问题…

烂柯人 2025-01-29 17:17:43 3 0

我如何在熊猫的一定时间段内选择最少的NAN值?

我的数据集和数据集缺失了很多数据,这些数据将每小时数据存储几年。现在,我将实施一种季节性填充方法,其中我需要二年来我拥有的最佳数据(2*8760条…

守护在此方 2025-01-29 03:36:18 4 0
更多

推荐作者

屋檐

文章 0 评论 0

最后的乘客

文章 0 评论 0

眼前雾蒙蒙

文章 0 评论 0

kidking

文章 0 评论 0

kill136

文章 0 评论 0

更多

友情链接

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文