基于类别代码替换大熊猫分类列的值

发布于 2025-02-06 16:43:45 字数 809 浏览 1 评论 0原文

我正在寻找更优雅的方法来替换基于类别代码的分类列的值。我无法使用map方法，因为原始值未提前知道。

我目前正在使用以下方法：

df['Gender'] = pd.Categorical.from_codes(df['Gender'].cat.codes.fillna(-1), categories=['Female', 'Male'])

这种方法感觉不高，因为我将分类列转换为整数，然后将其转换回分类。完整代码在下面。

import pandas as pd

df = pd.DataFrame({    
    'Name': ['Jack', 'John', 'Jil', 'Jax'],
    'Gender': ['M', 'M', 'F', pd.NA],
})

df['Gender'] = df['Gender'].astype('category')

# don't want to do this as original values may not be known to establish the dict
# df['Gender'] = df['Gender'].map({'M': 'Male', 'F': 'Female'})

# offline, we know 0 = Female, 1 = Male
# what is more elegant way to do below?
df['Gender'] = pd.Categorical.from_codes(df['Gender'].cat.codes.fillna(-1), categories=['Female', 'Male'])

原文

I am looking for more elegant approach to replace the values for categorical column based on category codes. I am not able to use map method as the original values are not known in advance.

I am currently using the following approach:

df['Gender'] = pd.Categorical.from_codes(df['Gender'].cat.codes.fillna(-1), categories=['Female', 'Male'])

This approach feels inelegant because I convert categorical column to integer, and then convert it back to categorical. Full code is below.

import pandas as pd

df = pd.DataFrame({    
    'Name': ['Jack', 'John', 'Jil', 'Jax'],
    'Gender': ['M', 'M', 'F', pd.NA],
})

df['Gender'] = df['Gender'].astype('category')

# don't want to do this as original values may not be known to establish the dict
# df['Gender'] = df['Gender'].map({'M': 'Male', 'F': 'Female'})

# offline, we know 0 = Female, 1 = Male
# what is more elegant way to do below?
df['Gender'] = pd.Categorical.from_codes(df['Gender'].cat.codes.fillna(-1), categories=['Female', 'Male'])

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

土豪 2025-02-13 16:43:45

这是一种创建独特项目字典的方法

，并使用枚举分配索引

d = {item: i for i, item in enumerate(df['Gender'].unique())}

使用映射来映射值

df['cat'] = df['Gender'].map(d)
df

    Name    Gender  cat
0   Jack    M       0
1   John    M       0
2   Jil     F       1
3   Jax     <NA>    2

here is one way to do that

create a dictionary of unique items and using enumerate assign an index

d = {item: i for i, item in enumerate(df['Gender'].unique())}

use map to map the values

df['cat'] = df['Gender'].map(d)
df

    Name    Gender  cat
0   Jack    M       0
1   John    M       0
2   Jil     F       1
3   Jax     <NA>    2

回复收藏 0 原文

网名女生简单气质 2025-02-13 16:43:45

使用？

df['Gender'] = (df['Gender'].astype('category')
                .cat.rename_categories(['Female', 'Male'])
               )

输出：

   Name  Gender
0  Jack    Male
1  John    Male
2   Jil  Female
3   Jax     NaN

What about using cat.rename_categories?

df['Gender'] = (df['Gender'].astype('category')
                .cat.rename_categories(['Female', 'Male'])
               )

output:

   Name  Gender
0  Jack    Male
1  John    Male
2   Jil  Female
3   Jax     NaN

回复收藏 0 原文

~没有更多了~

关于作者

独享拥抱

暂无简介

文章

28 人气

关注发私信

櫻之舞

文章 0 评论 0

关注

弥枳

文章 0 评论 0

关注

m2429

文章 0 评论 0

关注

寻找一个思念的角度

文章 0 评论 0

关注

野却迷人

文章 0 评论 0

关注

我怀念的。

文章 0 评论 0

友情链接

文江博客

基于类别代码替换大熊猫分类列的值

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

櫻之舞

弥枳

m2429

寻找一个思念的角度

野却迷人

我怀念的。

友情链接

基于类别代码替换大熊猫分类列的值

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

櫻之舞

弥枳

m2429

寻找一个思念的角度

野却迷人

我怀念的。

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。