pandas或者sklearn中如何将字符形式的标签数字化
例如我有一个标签列形如:
[A,A,A,B,B,C,C,C,C]
转化为:
[0,0,0,1,1,2,2,2,2]
pandas和scikit-learn中有简单的实现吗?
另外大家在学习一个新的包时是怎样根据问题找到文档的具体位置的?有啥经验可以交流下吗?谢谢啦!
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(4)
pandas
中是非常容易实现的,转换成Categories对象即可。术语叫做因子和水平,水平一般都会自动转成数字储存。接下来查看category的label即可
sklearn中有现成的:
详见官方文档
就可以直接字符数字间的转换了
没有实际运用过,不知道
map
函数能否实现你的需求,具体参考文档http://pandas.pydata.org/pand...
这只是个
映射
的逻辑而已,根本没必要用pandas和scikit-learn,大材小用了嘛如果非要说用pandas,那么这不正好是
Series
吗