每个 NA 值仅显示一行

发布于 2024-08-19 14:58:50 字数 1293 浏览 3 评论 0原文

在我的脚本中的某个时刻，我喜欢查看缺失值的数量在我的 data.frame 中并显示它们。就我而言：

out <- read.csv(file="...../OUT.csv", na.strings="NULL")

sum(is.na(out$codeHelper))

out[is.na(out$codeHelper),c(1,length(colnames(out)))]

它工作得很好。然而，最后一个命令显然给了我整个data.frame，其中NA是TRUE，例如：

5561                  Yemen (PDR) <NA>
5562                  Yemen (PDR) <NA>
5563                  Yemen (PDR) <NA>
5564                  Yemen (PDR) <NA>
5565                  Yemen (PDR) <NA>
5566                  Yemen (PDR) <NA>
5567                  Yemen (PDR) <NA>
5568                  Yemen (PDR) <NA>
5601 Zaire (Democ Republic Congo) <NA>
5602 Zaire (Democ Republic Congo) <NA>
5603 Zaire (Democ Republic Congo) <NA>
5604 Zaire (Democ Republic Congo) <NA>
5605 Zaire (Democ Republic Congo) <NA>

有一个大框架和很多NA 看起来相当混乱。对我来说重要的只是 NA 发生的地方，即哪个国家/地区（在第二列中）在第三列中缺少值。

那么我怎样才能只显示每个国家的一行呢？

它应该看起来像这样：

    1                  Yemen (PDR) <NA>
    2 Zaire (Democ Republic Congo) <NA>
    3                          USA <NA>
    4                     W. Samoa <NA>

原文

At some point in my script I like to see the number of missing values
in my data.frame and display them.
In my case I have:

out <- read.csv(file="...../OUT.csv", na.strings="NULL")

sum(is.na(out$codeHelper))

out[is.na(out$codeHelper),c(1,length(colnames(out)))]

It works perfectly fine.
However, the last command obviously gives me the whole data.frame where the NA is TRUE, eg:

5561                  Yemen (PDR) <NA>
5562                  Yemen (PDR) <NA>
5563                  Yemen (PDR) <NA>
5564                  Yemen (PDR) <NA>
5565                  Yemen (PDR) <NA>
5566                  Yemen (PDR) <NA>
5567                  Yemen (PDR) <NA>
5568                  Yemen (PDR) <NA>
5601 Zaire (Democ Republic Congo) <NA>
5602 Zaire (Democ Republic Congo) <NA>
5603 Zaire (Democ Republic Congo) <NA>
5604 Zaire (Democ Republic Congo) <NA>
5605 Zaire (Democ Republic Congo) <NA>

With a big frame and a lot of NAs that looks pretty messy.
Important to me is only where the NA occurs i.e which country
(in the second column) has a missing value in the third column.

So how can i only display a single row for each country?

It should look something like this:

    1                  Yemen (PDR) <NA>
    2 Zaire (Democ Republic Congo) <NA>
    3                          USA <NA>
    4                     W. Samoa <NA>

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

暖心男生 2024-08-26 14:58:50

unique(c(1,2,3,4,4))

会给你

1 2 3 4

所以

unique(out[is.na(out$codeHelper),c(1,length(colnames(out)))])

应该是您要找的？

回复收藏 0 原文

满地尘埃落定 2024-08-26 14:58:50

尝试这样的操作：

subset(dataframe.name, !duplicated(country.colname),
       select=c(col1.name, col2.name, ...))

另请参阅此相关问题：如何删除数据框中的部分重复项？

Try something like this:

subset(dataframe.name, !duplicated(country.colname),
       select=c(col1.name, col2.name, ...))

see also this related question: how to remove partial duplicates from a data frame?

回复收藏 0 原文

~没有更多了~

关于作者

心如狂蝶

暂无简介

0 文章

0 评论

22 人气

关注发私信

qq_FjTq5B

文章 0 评论 0

关注

18273202778

文章 0 评论 0

关注

WordPress小学生

文章 0 评论 0

关注

〃温暖了心ぐ

文章 0 评论 0

关注

迷乱花海

文章 0 评论 0

关注

niuniu

文章 0 评论 0

友情链接

文江博客

每个 NA 值仅显示一行

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

qq_FjTq5B

18273202778

WordPress小学生

〃温暖了心ぐ

迷乱花海

niuniu

友情链接

每个 NA 值仅显示一行

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

qq_FjTq5B

18273202778

WordPress小学生

〃温暖了心ぐ

迷乱花海

niuniu

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。