如何通过计算一列中的实例来从非数字数据集创建枢轴表?
我有这个看起来像这样的数据集:
我试图这样做:
df.groupby(['Phase','frames','Origin_Type']).size()
但是
pd.pivot_table(india, values = ['frames', 'Phase', 'Origin_Type'], index =['frames'],
columns = ['Phase', 'Origin_Type'], aggfunc = sum)
两者都没有给我正确的结果。我想将其转换为此(请参见下图),其中每个阶段每个“ Origin_Type”中每个主题的总和应该是每个阶段中的每个主题的总和。
链接到数据集
I have this dataset that looks like this:
I have tried to do this:
df.groupby(['Phase','frames','Origin_Type']).size()
and
pd.pivot_table(india, values = ['frames', 'Phase', 'Origin_Type'], index =['frames'],
columns = ['Phase', 'Origin_Type'], aggfunc = sum)
But both didnt give me the right results. I want to transform it to this (see pic below) wherein the values should be the sum of each theme found in each 'Origin_Type' per phase.
LINK to dataset here
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
您可以在此处检查
crosstab
You can check here
crosstab