如何删除所有记录中同时包含字母和数字值的 pandas 列
我有一个名为 df 的 pandas 数据框,包含大约 200 万条记录。 有一个名为 transaction_id
的列,可能包含:
- 某些记录的 alpha 值(例如“abscdwew”)
- 某些记录的数字值(例如“123454”)
- 字母值和数字值(例如“asd12354”)对于某些记录的
- 字母、数字和特殊字符(例如“asd435_!”) 对于某些记录的
- 特殊字符(例如“_-!”)
我想删除该列,如果所有值(即跨所有记录)包含:
- 字母和数值的组合(例如“aseder345”)
- 字母和特殊字符的组合(例如“asedre_!”)
- 数字和特殊字符的组合(例如“123_!”)
- 所有特殊字符(例如“< em>!")
有没有一种Python式的方法可以做到这一点?
因此,如果一列包含跨所有
I have a pandas dataframe called df
of about 2 million records.
There is a column called transaction_id
that might contain:
- alpha values (e.g. "abscdwew") for some records
- numeric values (e.g. "123454") for some records
- both alpha and numeric values (e.g. "asd12354") for some records
- alpha, numeric and special characters (e.g. "asd435_!") for some records
- special characters (e.g. "_-!")
I want to drop that column if ALL values (i.e. across ALL records) contain:
- combination of alpha and numeric values (e.g. "aseder345")
- combination of alpha and special characters (e.g. "asedre_!")
- combination of numeric and special characters (e.g. "123_!")
- all special characters (e.g. "!")
Is there a pythonic way of doing so?
So, if a column contains across al
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
鉴于以下玩具数据框,应删除COL1并根据您的标准保留COL2:
这是一种方法:
Given the following toy dataframe, in which col1 should be removed and col2 should be kept according to your criteria:
Here is one way to do it: