列出具有大于特定数字pandas的独特值的分类列列表

发布于 2025-02-09 06:35:58 字数 838 浏览 0 评论 0原文

我有一个带有分类，数字和日期列的DF。分类列的列表。

 date_time1      date_time2     cat_col1    cat_col_2    num_col1   num_col2   cat_col3
 2020-10-08       2021-11-08       ABC         xyz          20         40        PQR
 19:09:21.884     15:18:26.864
 2020-10-08       2021-11-08       BCD         xyz          30         50        ABC     
 19:09:21.884     15:18:26.864
 2020-10-08       2021-11-08       ABC         yza          40         30        MNO
 19:09:21.884     15:18:26.864  
 2020-10-08       2021-11-08       CDE         xyz          10         80        CDE
 19:09:21.884     15:18:26.864
 2020-10-08       2021-11-08       BCD         xyz          20         70        MNO
 19:09:21.884     15:18:26.864

我想列出所有具有唯一值超过2的应该

 mylist =['cat_col1', 'cat_col3']

有人可以帮我吗？

原文

I have a DF with categorical, numeric and date columns. I want to make a list of all categorical columns that have unique values more than 2. So my df is something like this

 date_time1      date_time2     cat_col1    cat_col_2    num_col1   num_col2   cat_col3
 2020-10-08       2021-11-08       ABC         xyz          20         40        PQR
 19:09:21.884     15:18:26.864
 2020-10-08       2021-11-08       BCD         xyz          30         50        ABC     
 19:09:21.884     15:18:26.864
 2020-10-08       2021-11-08       ABC         yza          40         30        MNO
 19:09:21.884     15:18:26.864  
 2020-10-08       2021-11-08       CDE         xyz          10         80        CDE
 19:09:21.884     15:18:26.864
 2020-10-08       2021-11-08       BCD         xyz          20         70        MNO
 19:09:21.884     15:18:26.864

I want to now get a list of only categorical column names which have unique value counts more than 2. So in this case it should be

 mylist =['cat_col1', 'cat_col3']

Can someone please help me with this?

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

别挽留 2025-02-16 06:35:58

如果要仅按名称选择列：

[col for col in df.columns if col.startswith('cat_') and df[col].nunique() > 2]

结果：

['cat_col1', 'cat_col3']

如果要按类型选择：

[col for col in df.select_dtypes(include='category').columns if df[col].nunique() > 2]

If you want to select the columns just by the name:

[col for col in df.columns if col.startswith('cat_') and df[col].nunique() > 2]

Result:

['cat_col1', 'cat_col3']

If you want to select by type:

[col for col in df.select_dtypes(include='category').columns if df[col].nunique() > 2]

回复收藏 0 原文

~没有更多了~

关于作者

弥繁

暂无简介

文章

28 人气

关注发私信

櫻之舞

文章 0 评论 0

关注

弥枳

文章 0 评论 0

关注

m2429

文章 0 评论 0

关注

寻找一个思念的角度

文章 0 评论 0

关注

野却迷人

文章 0 评论 0

关注

我怀念的。

文章 0 评论 0

友情链接

文江博客

列出具有大于特定数字pandas的独特值的分类列列表

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

櫻之舞

弥枳

m2429

寻找一个思念的角度

野却迷人

我怀念的。

友情链接

列出具有大于特定数字pandas的独特值的分类列列表

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

櫻之舞

弥枳

m2429

寻找一个思念的角度

野却迷人

我怀念的。

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。