Pandas DataFrame如何分组数值列的垃圾箱，然后对其他二进制列进行计数

发布于 2025-01-20 13:32:06 字数 430 浏览 2 评论 0原文

我有一个数据框：

c1 c2  SED f
1  2   0.2 1
3  3   0.7 1
3  1   0.1 0
8  1   0.6 0
9  2   1   1
4  9   8.3 1

我想将 SED 分组到宽度为 0.5 的 bin 和 foreach bin，计算列 f 为 1 的行数及其行数0.

所以对于这个例子我会得到：

SED_bin   cou_0   cou_1     
  0-0.5     1       1
  0.5-1     1       2
  8-8.5     0       1

最好的方法是什么？请注意，这只是 SED 值的一个示例，可能还有更多低于或高于此范围的值，因此我需要通用的分箱。

原文

I have a dataframe:

c1 c2  SED f
1  2   0.2 1
3  3   0.7 1
3  1   0.1 0
8  1   0.6 0
9  2   1   1
4  9   8.3 1

I want to group SED to bins of width 0.5 and foreach bin, count the number of rows the column f is 1 and the number of rows it is 0.

So for this example I will get:

SED_bin   cou_0   cou_1     
  0-0.5     1       1
  0.5-1     1       2
  8-8.5     0       1

What is the best way to do it?
Please note this is just an example of SED values and there could be more below to above this range so I need the binning to be generic.

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

浮华 2025-01-27 13:32:06

一个选项是使用剪切 + crosstab：

out = (pd.crosstab(pd.cut(df['SED'], np.arange(int(df['SED'].min()), int(df['SED'].max())+1, 0.5)), df['f'])
       .add_prefix('count_').rename_axis(index='SED_bins').reset_index())

输出：

f    SED_bins  count_0  count_1
0  (0.0, 0.5]        1        1
1  (0.5, 1.0]        1        2
2  (8.0, 8.5]        0        1

One option is to use cut + crosstab:

out = (pd.crosstab(pd.cut(df['SED'], np.arange(int(df['SED'].min()), int(df['SED'].max())+1, 0.5)), df['f'])
       .add_prefix('count_').rename_axis(index='SED_bins').reset_index())

Output:

f    SED_bins  count_0  count_1
0  (0.0, 0.5]        1        1
1  (0.5, 1.0]        1        2
2  (8.0, 8.5]        0        1

回复收藏 0 原文

~没有更多了~

关于作者

独孤求败

暂无简介

文章

27 人气

关注发私信

lylex099819

文章 0 评论 0

关注

yg

文章 0 评论 0

关注

mb_PT8LkUS5

文章 0 评论 0

关注

埋情葬爱

文章 0 评论 0

关注

佚名

文章 0 评论 0

关注

奢望

文章 0 评论 0

友情链接

文江博客

Pandas DataFrame如何分组数值列的垃圾箱，然后对其他二进制列进行计数

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

lylex099819

yg

mb_PT8LkUS5

埋情葬爱

佚名

奢望

友情链接

Pandas DataFrame如何分组数值列的垃圾箱，然后对其他二进制列进行计数

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

lylex099819

yg

mb_PT8LkUS5

埋情葬爱

佚名

奢望

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。