missing-data

missing-data

文章 0 浏览 4

谁能告诉我为什么我的管道错了?

我正在尝试建立一个管道,以便执行GridSearchCV以找到最佳参数。我已经将数据分为火车和验证,并具有以下代码: cols = ['home_ownership', "purpose"…

囍孤女 2025-01-24 23:28:56 0 0

用不同的特定值替换多列中缺少的数据

我有一个巨大的数据框架,我需要替换几个缺少值,如下所示: 循环A 周期B 周期C ..... na na na na na na na na na na na na na -1 na 0 -1 -1 -2 0 n…

酒几许 2025-01-23 01:07:53 0 0

如何用最高值替换熊猫中特定列的连续零值

假设我有这样的数据框架, import pandas as pd data = {'first_column': ['A', 'null', 'null', 'B', 'null', 'null', 'null' ], 'second_column': […

╭ゆ眷念 2025-01-22 07:19:04 0 0

通过python中的一系列日期迭代,日期缺失

在这里,我得到了熊猫数据框架,每天的股票回报是日期和回报率。 但是,如果我只想保留每周的最后一天,并且数据有一些丢失的日子,我该怎么办? impo…

原谅我要高飞 2025-01-22 02:35:32 0 0

根据另一个变量替换Na,而将NA替换为观察Na,而Na没有无误的邻居

在这里,我有一个看起来像这样的数据: year <- c(2000,2001,2002,2003,2005,2006,2007,2008,2009,2010) x <- c(1,2,3,NA,5,NA,NA,NA,9,10) dat <- da…

千柳 2025-01-21 19:23:45 0 0

python/pandas,如何填充持续时间列的缺失值?

我的数据(DF)具有一个“ duration_time”列,其值在几分钟和几秒钟内: 10:43 这些值在5到15分钟之间。 此列的数据类型是“对象”。 此列中有几个缺…

蔚蓝源自深海 2025-01-21 15:33:35 0 0

将丢失的日期添加到CSV文件的时间序列中

我有一个每月的时间序列的变量“ GWL”,但有几个丢失的日期。 import pandas as pd df = pd.read_csv(r'1218_29_0.csv') df.head(5) date GWL 0 15/0…

掐死时间 2025-01-21 11:50:24 0 0

R 函数 gg_miss_fct 的 Python 等价物是什么?

在r中,gg_miss_fct通过一个热图获得缺少的值百分比,我该如何等效地获得python?…

无可置疑 2025-01-20 03:37:17 1 0

检查矩阵中的至少2列至少具有3个值...但是它们必须在相同的行中(用于成对测试)

假设我有一个如下所示的矩阵: set.seed(123) newmat=matrix(rnorm(25),ncol=5) colnames(newmat)=paste0('mark',1:5) rownames(newmat)=paste0('id',…

假扮的天使 2025-01-19 06:41:23 2 0

如何使用是识别na的na,' “” ETC

我有 2 个问题: 问题 1:我正在尝试找出如何识别任何常见的缺失值格式,例如 NA、" "、""。 我认为 is.na 会识别所有这些格式,有人可以为我指明我需…

暗地喜欢 2025-01-19 06:11:30 1 0

保存小块内核

根据 mouseforest 文档 (https://github.com/ AnotherSamWilson/miceforest#Imputing-New-Data-with-Existing-Models)据说可以保存内核并在以后重新…

离笑几人歌 2025-01-19 06:09:46 1 0

如果超过90%的功能在熊猫中缺少价值,如何放弃整个记录

我有一个名为 df 的 pandas 数据框,包含 500 列和 200 万条记录。 我能够删除包含超过 90% 缺失值的列。 但是,如果整个记录中 90% 或更多的列缺少值…

爱*していゐ 2025-01-19 03:26:49 2 0

读取 csv 文件时更改列格式

我有这个 csv 文件(名为 df.csv): 我使用此代码阅读了它: import pandas as pd df = pd.read_csv('df.csv') 并使用此代码将其打印出来: print(df…

只为一人 2025-01-19 03:15:42 1 0

如何处理 R 中的 tibbles 列表及其内容?

让我们仅出于示例目的考虑以下R代码: X <- tibble(v0=seq( as.Date("2011-07-01"), by=1, len=6),v1 = c(1,-1,2,1,2,-1), v2 = replicate(6, 0), v3 …

姐不稀罕 2025-01-18 17:34:00 1 0

保留Na为&lt; =总变量的20%的观测值

假设我们有一个包含六个观测值和四个变量的数据框 df <- data.frame(a = c(1, NA, NA, 4, NA, 5), b = c(NA, NA, NA, NA, NA, 1), c = c(1, 2, 3, 4, …

呆头 2025-01-18 13:53:39 1 0
更多

推荐作者

少女净妖师

文章 0 评论 0

朱洁

文章 0 评论 0

觉浅

文章 0 评论 0

滥情空心

文章 0 评论 0

hl1314520

文章 0 评论 0

更多

友情链接

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文