熊猫 - 枢轴/堆栈/unstack/熔体

发布于 2025-01-31 08:13:12 字数 2948 浏览 3 评论 0原文

我有一个看起来像这样的数据框：

名称	值1	值2
A	100	101
A	100	102
A	100	103
B	200	201
b	200 B 200	202
B	200	203
C	300	301 C 300 301
C	300	302
C	300	303

，我正在尝试实现此处：

名称	值1	值2	值3	值4	值5	值6
A	100	101	100	102	100	103
B	200	201	200	202	200	203
C	300	301 300	302	300	300	303

这是我到目前为止尝试的； dataframe.stack（） dataframe.unstack（） dataframe.melt（id_vars = ['name']）

我需要通过确保;

第一行保持原样，但是与同名相关的每个后续值都应将其转换为coulmn。
第二个值b（对于。ex）应将其关联的值作为新值下的新值转置，但它不应完全形成单独的值。

原文

I have a dataframe that looks like this:

name	value 1	value 2
A	100	101
A	100	102
A	100	103
B	200	201
B	200	202
B	200	203
C	300	301
C	300	302
C	300	303

And I'm trying to get to this:

name	value 1	value 2	value 3	value 4	value 5	value 6
A	100	101	100	102	100	103
B	200	201	200	202	200	203
C	300	301	300	302	300	303

Here is what i have tried so far;
dataframe.stack()
dataframe.unstack()
dataframe.melt(id_vars=['name'])

I need to transpose the data by ensuring that;

The first row remains as it is but every subsequent value associated with the same name should be transposed to a coulmn.
Whereas the second value B (for. ex) should transpose it's associated value as a new value under the column A values, it should not form a separate altogether.

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

触ぅ动初心 2025-02-07 08:13:12

尝试：

def fn(x):
    vals = x.values.ravel()
    return pd.DataFrame(
        [vals],
        columns=[f"value {i}" for i in range(1, vals.shape[0] + 1)],
    )


out = (
    df.set_index("name")
    .groupby(level=0)
    .apply(fn)
    .reset_index()
    .drop(columns="level_1")
)
print(out.to_markdown())

打印：

	名称	值1	值2	值3	值4	值5	值6
0	A	100	101	100	102	100	103
1	B	200	201	200	202	200	203
2	C	300	301	300 302	300	300	303

Try:

def fn(x):
    vals = x.values.ravel()
    return pd.DataFrame(
        [vals],
        columns=[f"value {i}" for i in range(1, vals.shape[0] + 1)],
    )


out = (
    df.set_index("name")
    .groupby(level=0)
    .apply(fn)
    .reset_index()
    .drop(columns="level_1")
)
print(out.to_markdown())

Prints:

	name	value 1	value 2	value 3	value 4	value 5	value 6
0	A	100	101	100	102	100	103
1	B	200	201	200	202	200	203
2	C	300	301	300	302	300	303

回复收藏 0 原文

够钟 2025-02-07 08:13:12

每个名称的平坦值

(
    df.set_index('name')
    .groupby(level=0)
    .apply(lambda x: pd.Series(x.values.flat))
    .rename(columns=lambda x: f'value {x + 1}')
    .reset_index()
)

Flatten values for each name

(
    df.set_index('name')
    .groupby(level=0)
    .apply(lambda x: pd.Series(x.values.flat))
    .rename(columns=lambda x: f'value {x + 1}')
    .reset_index()
)

回复收藏 0 原文

顾挽 2025-02-07 08:13:12

使用融化， groupby`和 pivot_wider （来自 pyjanitor ）：

# pip install pyjanitor
import pandas as pd
import janitor

(df
.melt('name', ignore_index = False)
.sort_index()
.drop(columns='variable')
.assign(header = lambda df: df.groupby('name').cumcount() + 1)
.pivot_wider('name', 'header', names_sep = ' ')
)
  name  value 1  value 2  value 3  value 4  value 5  value 6
0    A      100      101      100      102      100      103
1    B      200      201      200      202      200      203
2    C      300      301      300      302      300      303

One option using melt,groupby`, and pivot_wider (from pyjanitor):

# pip install pyjanitor
import pandas as pd
import janitor

(df
.melt('name', ignore_index = False)
.sort_index()
.drop(columns='variable')
.assign(header = lambda df: df.groupby('name').cumcount() + 1)
.pivot_wider('name', 'header', names_sep = ' ')
)
  name  value 1  value 2  value 3  value 4  value 5  value 6
0    A      100      101      100      102      100      103
1    B      200      201      200      202      200      203
2    C      300      301      300      302      300      303

回复收藏 0 原文

~没有更多了~