删除具有恒定字母数字值的 pandas 列
我有一个dataframe df
,其中包含大约200万个记录。 其中一些列仅包含字母数值(例如“ WER345”,“ GFER34”,“ 123FDST”)。
是否有pythonic删除这些列的方法(例如使用isalnum()
)?
I have a dataframe df
that contains around 2 million records.
Some of the columns contain only alphanumeric values (e.g. "wer345", "gfer34", "123fdst").
Is there a pythonic way to drop those columns (e.g. using isalnum()
)?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
应用
Series.str.isalnum
按列屏蔽 DataFrame 的所有字母数字值。然后使用DataFrame.all
查找仅包含字母数字值的列。反转生成的布尔系列以仅选择包含至少一个非字母数字值的列。示例
输出:
Apply
Series.str.isalnum
column-wise to mask all the alphanumeric values of the DataFrame. Then useDataFrame.all
to find the columns that only contain alphanumeric values. Invert the resulting boolean Series to select only the columns that contain at least one non-alphanumeric value.Example
Output: