根据r中的最大值(对于多列)选择重复项
因此,我有一个具有多个重复项的数据集,我想创建一个数据集,该数据集在多个值中选择最大值。因此:例如:
ID Value1 Value2 Value3 Gender Race
1 45 76 87 M B
1 34 45 95 M B
2 67 100 92 F W
2 43 70 89 F W
3 34 95 80 F A
3 22 41 90 F A
4 78 25 7 M W
4 32 37 13 M W
5 56 105 25 M B
5 80 59 45 M B
将成为这个:
ID Value1 Value2 Value3 Gender Race
1 45 76 95 M B
2 67 100 92 F W
3 34 95 90 F A
4 78 56 13 M W
5 80 105 45 M B
我有一种与总结命令有关的感觉(尽管有40个值变量,所以我担心为每个变量编写一系列代码)或此处提供的某些解决方案(我不知道如何为我的需求进行修改):
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(2)
您可以使用
汇总
函数如下,在2022-05-30上由(v2.0.1)
You can use
aggregate
function as follows ,Created on 2022-05-30 by the reprex package (v2.0.1)
您可以通过
ID
,性别
和race
进行分组,并汇总value
变量以获取其最大值。You can group by
ID
,Gender
andRace
and summarise theValue
variables to get their max.