用不同的特定值替换多列中缺少的数据

发布于 2025-01-23 01:07:53 字数 2303 浏览 4 评论 0原文

我有一个巨大的数据框架，我需要替换几个缺少值，如下所示：

循环A	周期B	周期C
na	na na	na
na	na na	na
na na	na	na na
-1	na	0
-1 -1	-2	0
na	-2	Na
na	na	na
na	na	1
0	-1	1
0	-1	na na
na	na	na na
na	na	na
na na	0	2
1	0	2
1	na	na na
na	na	na na

na na na na n na n a i需要用出现的下一个数字替换na有类似的东西：

A周期	B	周期C
-1	-2	0
-1 -1	-2	0
-1	-2	0
-1 -1	-2	0
-1	-2	0
0 0	0 -2	-2 1
0	-1	1
0 0	-1	1
0	-1	1
0	-1	2
1	0	2 1 0
2 1	0	2
1	0	2
1	0	2
1	1	3
2	1	3

任何想法如何做？谢谢。

原文

I have a huge data frame with several missing value that I need to replace as follow:

Cycle A	Cycle B	Cycle C
na	na	na
na	na	na
na	na	na
-1	na	0
-1	-2	0
na	-2	na
na	na	na
na	na	1
0	-1	1
0	-1	na
na	na	na
na	na	na
na	0	2
1	0	2
1	na	na
na	na	na

For each column I need to replace the NA's by the next number that appears, to have something like that:

Cycle A	Cycle B	Cycle C
-1	-2	0
-1	-2	0
-1	-2	0
-1	-2	0
-1	-2	0
0	-2	1
0	-1	1
0	-1	1
0	-1	1
0	-1	2
1	0	2
1	0	2
1	0	2
1	0	2
1	1	3
2	1	3

Any idea how to do that?
Thank you.

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

固执像三岁 2025-01-30 01:07:53

假设您要在所有start_with周期的所有列中执行替换。

第一个填充函数将na替换为下一个行值。 突变函数在最后一行中替换Na是最后一个非NA值 + 1。

library(tidyverse)

df %>% 
  fill(starts_with("Cycle"), .direction = "up") %>% 
  mutate(across(starts_with("Cycle"), ~ replace_na(.x, last(.x[!is.na(.x)]) + 1)))

   CycleA CycleB CycleC
1      -1     -2      0
2      -1     -2      0
3      -1     -2      0
4      -1     -2      0
5      -1     -2      0
6       0     -2      1
7       0     -1      1
8       0     -1      1
9       0     -1      1
10      0     -1      2
11      1      0      2
12      1      0      2
13      1      0      2
14      1      0      2
15      1      1      3
16      2      1      3

Assume you want to perform replacement in all columns that starts_with Cycle.

The first fill function replaces NA with the next row values. The mutate function replaces NA in the last row to be last non-NA value + 1.

library(tidyverse)

df %>% 
  fill(starts_with("Cycle"), .direction = "up") %>% 
  mutate(across(starts_with("Cycle"), ~ replace_na(.x, last(.x[!is.na(.x)]) + 1)))

   CycleA CycleB CycleC
1      -1     -2      0
2      -1     -2      0
3      -1     -2      0
4      -1     -2      0
5      -1     -2      0
6       0     -2      1
7       0     -1      1
8       0     -1      1
9       0     -1      1
10      0     -1      2
11      1      0      2
12      1      0      2
13      1      0      2
14      1      0      2
15      1      1      3
16      2      1      3

回复收藏 0 原文

知足的幸福 2025-01-30 01:07:53

首先，将转换为na和type.covert的数字值。

dat <- replace(dat, dat== 'na', NA) |> type.convert(as.is=TRUE)

接下来，我可能错了，您是否正在寻找这种基本结构？

f <- \(x) {
  rp <- cumsum(c(0, diff(!is.na(x))) > 0) + min(x, na.rm=TRUE)
  nas <- is.na(x)
  x[nas] <- rp[nas]
  x
}

cols <- c("CycleA", "CycleB", "CycleC")  ## select columns

dat[cols] <- lapply(dat[cols], f)
dat
#    CycleA CycleB CycleC
# 1      -1     -2      0
# 2      -1     -2      0
# 3      -1     -2      0
# 4      -1     -2      0
# 5      -1     -2      0
# 6       0     -2      1
# 7       0     -1      1
# 8       0     -1      1
# 9       0     -1      1
# 10      0     -1      2
# 11      1      0      2
# 12      1      0      2
# 13      1      0      2
# 14      1      0      2
# 15      1      1      3
# 16      2      1      3

数据：

dat <- structure(list(CycleA = c("na", "na", "na", "-1", "-1", "na", 
"na", "na", "0", "0", "na", "na", "na", "1", "1", "na"), CycleB = c("na", 
"na", "na", "na", "-2", "-2", "na", "na", "-1", "-1", "na", "na", 
"0", "0", "na", "na"), CycleC = c("na", "na", "na", "0", "0", 
"na", "na", "1", "1", "na", "na", "na", "2", "2", "na", "na")), class = "data.frame", row.names = c(NA, 
-16L))

First, convert "na" to NA and type.covert for numeric values.

dat <- replace(dat, dat== 'na', NA) |> type.convert(as.is=TRUE)

Next, I might be wrong, are you looking for this underlying structure?

f <- \(x) {
  rp <- cumsum(c(0, diff(!is.na(x))) > 0) + min(x, na.rm=TRUE)
  nas <- is.na(x)
  x[nas] <- rp[nas]
  x
}

cols <- c("CycleA", "CycleB", "CycleC")  ## select columns

dat[cols] <- lapply(dat[cols], f)
dat
#    CycleA CycleB CycleC
# 1      -1     -2      0
# 2      -1     -2      0
# 3      -1     -2      0
# 4      -1     -2      0
# 5      -1     -2      0
# 6       0     -2      1
# 7       0     -1      1
# 8       0     -1      1
# 9       0     -1      1
# 10      0     -1      2
# 11      1      0      2
# 12      1      0      2
# 13      1      0      2
# 14      1      0      2
# 15      1      1      3
# 16      2      1      3

Data:

dat <- structure(list(CycleA = c("na", "na", "na", "-1", "-1", "na", 
"na", "na", "0", "0", "na", "na", "na", "1", "1", "na"), CycleB = c("na", 
"na", "na", "na", "-2", "-2", "na", "na", "-1", "-1", "na", "na", 
"0", "0", "na", "na"), CycleC = c("na", "na", "na", "0", "0", 
"na", "na", "1", "1", "na", "na", "na", "2", "2", "na", "na")), class = "data.frame", row.names = c(NA, 
-16L))

回复收藏 0 原文

~没有更多了~