R:根据唯一列过滤数据集
可能的重复:
R:跨多个列查找模式 - 可能重复()?
亲爱的大家,
这是我的数据集的一部分:
name chr start stop strand alias
60 uc003vqx.2 chr7 130835560 130891916 - PODXL
61 uc003xlp.1 chr8 38387812 38445509 - FLG
62 uc003xlu.1 chr8 38400008 38445509 - FLG
63 uc003xlv.1 chr8 38400008 38445509 - FLG
64 uc003xtz.1 chr8 61263976 61356508 - CA8
65 uc003xua.1 chr8 61283183 61356508 - CA8
66 uc010lwg.1 chr8 38387812 38445509 - FLG
67 uc010lwh.1 chr8 38387812 38445509 - FLG
68 uc010lwj.1 chr8 38387812 38445509 - FLG
我想根据唯一的开始、停止和别名列来过滤数据集。最终的结果一定是这样的:
name chr start stop strand alias
60 uc003vqx.2 chr7 130835560 130891916 - PODXL
61 uc003xlp.1 chr8 38387812 38445509 - FLG
62 uc003xlu.1 chr8 38400008 38445509 - FLG
64 uc003xtz.1 chr8 61263976 61356508 - CA8
65 uc003xua.1 chr8 61283183 61356508 - CA8
66 uc010lwg.1 chr8 38387812 38445509 - FLG
有谁知道这个问题有没有解决办法? 谢谢!
Possible Duplicate:
R: Finding patterns across multiple columns- possibly duplicated()?
Dear all,
Here is a part of my dataset:
name chr start stop strand alias
60 uc003vqx.2 chr7 130835560 130891916 - PODXL
61 uc003xlp.1 chr8 38387812 38445509 - FLG
62 uc003xlu.1 chr8 38400008 38445509 - FLG
63 uc003xlv.1 chr8 38400008 38445509 - FLG
64 uc003xtz.1 chr8 61263976 61356508 - CA8
65 uc003xua.1 chr8 61283183 61356508 - CA8
66 uc010lwg.1 chr8 38387812 38445509 - FLG
67 uc010lwh.1 chr8 38387812 38445509 - FLG
68 uc010lwj.1 chr8 38387812 38445509 - FLG
I would like to filter the dataset based on unique start,stop and alias column. The final result must be like this:
name chr start stop strand alias
60 uc003vqx.2 chr7 130835560 130891916 - PODXL
61 uc003xlp.1 chr8 38387812 38445509 - FLG
62 uc003xlu.1 chr8 38400008 38445509 - FLG
64 uc003xtz.1 chr8 61263976 61356508 - CA8
65 uc003xua.1 chr8 61283183 61356508 - CA8
66 uc010lwg.1 chr8 38387812 38445509 - FLG
Does anyone know if there is a solution for this?
Thanks!
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(2)
我认为您的示例输出有错误,请尝试
I think your example output is in error, Try
使用
duplicated
函数:复制数据:
删除重复项:
Use the
duplicated
function:Replicate the data:
Remove duplicates: