如何通过计算一列中的实例来从非数字数据集创建枢轴表?

发布于 2025-01-22 09:44:39 字数 758 浏览 0 评论 0原文

我有这个看起来像这样的数据集:

”在此处输入图像描述

我试图这样做:

df.groupby(['Phase','frames','Origin_Type']).size()

但是

pd.pivot_table(india, values = ['frames', 'Phase', 'Origin_Type'], index =['frames'],
                          columns = ['Phase', 'Origin_Type'], aggfunc = sum)

两者都没有给我正确的结果。我想将其转换为此(请参见下图),其中每个阶段每个“ Origin_Type”中每个主题的总和应该是每个阶段中的每个主题的总和。

链接到数据集

I have this dataset that looks like this:

enter image description here

I have tried to do this:

df.groupby(['Phase','frames','Origin_Type']).size()

and

pd.pivot_table(india, values = ['frames', 'Phase', 'Origin_Type'], index =['frames'],
                          columns = ['Phase', 'Origin_Type'], aggfunc = sum)

But both didnt give me the right results. I want to transform it to this (see pic below) wherein the values should be the sum of each theme found in each 'Origin_Type' per phase.

enter image description here

LINK to dataset here

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

安静被遗忘 2025-01-29 09:44:39

您可以在此处检查crosstab

pd.crosstab(india['Location'],[india['Phase'], india['Origin_Type']])

You can check here crosstab

pd.crosstab(india['Location'],[india['Phase'], india['Origin_Type']])
~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文