R：通过多对多映射根据另一列过滤一列

发布于 2025-01-20 22:01:58 字数 551 浏览 2 评论 0原文

我有一个带有ID列和项目列的数据集。 ID映射到一个或多个项目。该数据集对映射到ID的每个项目都有一行。我想返回包含my_items的ID。物品的顺序无关紧要。我下面有一个玩具示例。

ID <- c(1, 1, 1, 2, 2, 2, 2, 3, 3, 4, 5, 5, 5)
item <- c("a", "b", "c", "a", "b", "c", "d", "a", "b", "d", "b", "a", "c")
df <- data.frame(cbind(ID, item))
df

my_items <- c("a", "b", "c")

我的预期输出仅包括项目ID 1和5。

原文

I have a dataset with an ID column and an item column. An ID is mapped to one or more items. The dataset has a row for each item mapped to an ID. I want to return IDs that contain my_items. The order of the items does not matter. I have a toy example below.

ID <- c(1, 1, 1, 2, 2, 2, 2, 3, 3, 4, 5, 5, 5)
item <- c("a", "b", "c", "a", "b", "c", "d", "a", "b", "d", "b", "a", "c")
df <- data.frame(cbind(ID, item))
df

my_items <- c("a", "b", "c")

My expected output would only include item ID 1 and 5.

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

z祗昰~ 2025-01-27 22:01:58

df %>% 
  group_by(ID) %>%
  filter(setequal(item,my_items))

输出

  ID    item 
  <chr> <chr>
1 1     a    
2 1     b    
3 1     c    
4 5     b    
5 5     a    
6 5     c

df %>% 
  group_by(ID) %>%
  filter(setequal(item,my_items))

Output

  ID    item 
  <chr> <chr>
1 1     a    
2 1     b    
3 1     c    
4 5     b    
5 5     a    
6 5     c

回复收藏 0 原文

左岸枫 2025-01-27 22:01:58

我们可以在使用 %in% 创建逻辑向量并按“ID”分组后使用 all，还可以使用 n_distinct

library(dplyr)
df %>% 
   group_by(ID) %>% 
   filter(all(my_items %in% item), n_distinct(item) == 3) %>%
   ungroup

-output创建条件

# A tibble: 6 × 2
     ID item 
  <dbl> <chr>
1     1 a    
2     1 b    
3     1 c    
4     5 b    
5     5 a    
6     5 c

We can use all after creating a logical vector with %in% and grouping by 'ID' and also create a condition with n_distinct

library(dplyr)
df %>% 
   group_by(ID) %>% 
   filter(all(my_items %in% item), n_distinct(item) == 3) %>%
   ungroup

-output

# A tibble: 6 × 2
     ID item 
  <dbl> <chr>
1     1 a    
2     1 b    
3     1 c    
4     5 b    
5     5 a    
6     5 c

回复收藏 0 原文

浅笑依然 2025-01-27 22:01:58

如果我们添加安排，在这种情况下，我们也可以使用相同的：

library(dplyr)

  df %>% 
    group_by(ID) %>%
    arrange(item, .by_group = TRUE) %>% 
    filter(identical(item,my_items))

  ID    item 
  <chr> <chr>
1 1     a    
2 1     b    
3 1     c    
4 5     a    
5 5     b    
6 5     c

If we add arrange, we could also use identical in this case:

library(dplyr)

  df %>% 
    group_by(ID) %>%
    arrange(item, .by_group = TRUE) %>% 
    filter(identical(item,my_items))

  ID    item 
  <chr> <chr>
1 1     a    
2 1     b    
3 1     c    
4 5     a    
5 5     b    
6 5     c

回复收藏 0 原文

~没有更多了~

关于作者

柠檬色的秋千

暂无简介

文章

26 人气

关注发私信

一笔一画续写前缘

文章 0 评论 0

关注

mb_XvqQsWhl

文章 0 评论 0

关注

我不在是我

文章 0 评论 0

关注

依靠

文章 0 评论 0

关注

L.W.

文章 0 评论 0

关注

暗里之光

文章 0 评论 0

友情链接

文江博客

R：通过多对多映射根据另一列过滤一列

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（3）

关于作者

相关话题

热门标签

推荐作者

一笔一画续写前缘

mb_XvqQsWhl

我不在是我

依靠

L.W.

暗里之光

友情链接

R：通过多对多映射根据另一列过滤一列

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（3）

关于作者

相关话题

热门标签

推荐作者

一笔一画续写前缘

mb_XvqQsWhl

我不在是我

依 靠

L.W.

暗里之光

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

依靠