当前位置：文江博客话题详情

Python pandas scikit-learn

pandas或者sklearn中如何将字符形式的标签数字化

发布于 2022-09-04 08:08:03 字数 171 浏览 44 评论 0

例如我有一个标签列形如：
[A,A,A,B,B,C,C,C,C]
转化为：
[0,0,0,1,1,2,2,2,2]

pandas和scikit-learn中有简单的实现吗？

另外大家在学习一个新的包时是怎样根据问题找到文档的具体位置的？有啥经验可以交流下吗？谢谢啦！

收藏 0

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

评论（4）

紙鸢 2022-09-11 08:08:03

pandas中是非常容易实现的,转换成Categories对象即可。术语叫做因子和水平，水平一般都会自动转成数字储存。

c = ['A','A','A','B','B','C','C','C','C']
category = pd.Categorical(c)

接下来查看category的label即可

print category.labels

青瓷清茶倾城歌 2022-09-11 08:08:03

sklearn中有现成的:

preprocessing.LabelEncoder().fit_transform(data)

详见官方文档

就可以直接字符数字间的转换了

∞梦里开花 2022-09-11 08:08:03

没有实际运用过，不知道map函数能否实现你的需求，具体参考文档
http://pandas.pydata.org/pand...

冰魂雪魄 2022-09-11 08:08:03

这只是个映射的逻辑而已，根本没必要用pandas和scikit-learn，大材小用了嘛

a = ['A','A','A','B','B','C','C','C','C']
result = [x for x in map(lambda c: ord(c) - ord('A'), a)]

如果非要说用pandas，那么这不正好是 Series吗

import pandas as pd
a = ['A','A','A','B','B','C','C','C','C']
result = pd.Series(a).map(lambda c: ord(c) - ord('A'))

~没有更多了~

关于作者

独﹏钓一江月

暂无简介

0 文章

0 评论

24 人气

关注发私信

相关话题

热门标签

操作系统程序设计 IT运维 Linux系统管理 JavaScript 服务器应用 solaris C/C++ PHP Shell BSD Vue.js aix Oracle Python HTML 系统管理 HTML5 CSS 前端

推荐作者

胡图图

文章 0 评论 0

zt006

文章 0 评论 0

z祗昰~

文章 0 评论 0

冰葑

文章 0 评论 0

野の

文章 0 评论 0

天空

文章 0 评论 0

友情链接

我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的隐私政策了解更多相关信息。单击 接受 或继续使用网站，即表示您同意使用 Cookies 和您的相关数据。

原文