熊猫函数以基于单列创建多个列

发布于 2025-02-11 04:01:14 字数 1230 浏览 2 评论 0原文

我有一个看起来像这样的数据集

A	B	C
A1	1	1.3
A1	2	1.4
A1	3	1.3
A2	1	1.6
A2	A2 2	1.7
A2	3	1.5
A1	1 A1	1 A1 1
A1	2	2.7
A1	3	2.4
A2	1	1.6
A2 1 1.6 A2	2	1.7
A2 A2	3	1.2

所需的输出

A	1	2	3
A1	1.3	1.4	1.3
A1	1	2.7	2.7
A2	1.7	1.6 1.6	1.5
A2	1.6	1.7	1.2

我尝试了一个枢轴表，但它给出了聚合，没有聚合枢轴，它显示出重复的索引错误，因为重复的索引。处理此问题的最佳方法是什么？

原文

I have a dataset which looks like this

A	B	C
A1	1	1.3
A1	2	1.4
A1	3	1.3
A2	1	1.7
A2	2	1.6
A2	3	1.5
A1	1	1
A1	2	2.7
A1	3	2.4
A2	1	1.6
A2	2	1.7
A2	3	1.2

Desired output :

A	1	2	3
A1	1.3	1.4	1.3
A1	1	2.7	2.4
A2	1.7	1.6	1.5
A2	1.6	1.7	1.2

I have tried a pivot table but it's giving aggregation and without aggregation pivot it is showing a duplicate index error because of the duplicate index. What is the best way to handle this?

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

我的影子我的梦 2025-02-18 04:01:14

方式进行迭代：

dfx = df.pivot_table(index='A', columns='B', values='C', aggfunc=list)
pd.concat([dfx.applymap(lambda x:x[idx]) for idx in range(dfx.apply(lambda x: len(x)).max())])

A	1	2	3
A1	1.3	1.3 1.4	1.3
A2	1.7	1.6 1.6	1.5
A1	1	2.7	2.7 2.4
A2	1.6 1.6 1.6 1.7	1.7	1.2

组合都具有相同数量的元素）与以下

您可以使用数量的元素数量（假设所有简单的枢轴应该做：

df.pivot_table(index='A', columns='B', values='C', aggfunc='mean')

You can iterate over using number of elements (assuming all combos have same number of elements) as follows:

dfx = df.pivot_table(index='A', columns='B', values='C', aggfunc=list)
pd.concat([dfx.applymap(lambda x:x[idx]) for idx in range(dfx.apply(lambda x: len(x)).max())])

A	1	2	3
A1	1.3	1.4	1.3
A2	1.7	1.6	1.5
A1	1	2.7	2.4
A2	1.6	1.7	1.2

Old answer:

Seeing your sample dataframe, a simple pivot should do:

df.pivot_table(index='A', columns='B', values='C', aggfunc='mean')

回复收藏 0 原文

是伱的 2025-02-18 04:01:14

尝试：

df = df.pivot_table(index="A", columns="B", values="C", aggfunc=list)
df = df.explode(df.columns.to_list()).reset_index()
df.columns.name = None
print(df)

打印：

    A    1    2    3
0  A1  1.3  1.4  1.3
1  A1  1.0  2.7  2.4
2  A2  1.7  1.6  1.5
3  A2  1.6  1.7  1.2

Try:

df = df.pivot_table(index="A", columns="B", values="C", aggfunc=list)
df = df.explode(df.columns.to_list()).reset_index()
df.columns.name = None
print(df)

Prints:

    A    1    2    3
0  A1  1.3  1.4  1.3
1  A1  1.0  2.7  2.4
2  A2  1.7  1.6  1.5
3  A2  1.6  1.7  1.2

回复收藏 0 原文

倾城月光淡如水﹏ 2025-02-18 04:01:14

一种选项是创建一个额外的列，在旋转之前，将其引入您的数据唯一性：

a = df.groupby('A').ngroup().diff().fillna(0, downcast = 'infer')
a = a.mask(a < 0, 1).cumsum()
(df
.assign(temp = a)
.pivot(['temp', 'A'], 'B', 'C')
.droplevel(0)
.rename_axis(columns = None)
)

      1    2    3
A
A1  1.3  1.4  1.3
A2  1.7  1.6  1.5
A1  1.0  2.7  2.4
A2  1.6  1.7  1.2

One option is to create an extra column that introduces uniqueness to your data, before pivoting:

a = df.groupby('A').ngroup().diff().fillna(0, downcast = 'infer')
a = a.mask(a < 0, 1).cumsum()
(df
.assign(temp = a)
.pivot(['temp', 'A'], 'B', 'C')
.droplevel(0)
.rename_axis(columns = None)
)

      1    2    3
A
A1  1.3  1.4  1.3
A2  1.7  1.6  1.5
A1  1.0  2.7  2.4
A2  1.6  1.7  1.2

回复收藏 0 原文

~没有更多了~