减去熊猫中每个组项目的独特价值

发布于 2025-01-27 17:00:37 字数 866 浏览 2 评论 0原文

我有一个具有唯一值（DF_VALUES）的数据框，我想在另一个dataframe（df）的一列中从所有行中减去

>>> df_values
    Id  value  
0   1    2    
1   2    3    
2   3    2

我可以通过定义这样的函数来做到这一点：

def conv(x, y, p):
    if y == 1:
        return x-p[0]
    elif y == 2:
        return x-p[1]
    elif y == 3:
        return x-p[2]

df['norm']=df.apply(lambda x : conv(x['T_air'], x['Id'],df_value['value']), axis=1)

因此，结果是：

>>> df
    Id  T_air  norm
0   1    2      0
1   1    4      2
2   1    2      0
3   2    3      0
4   2    4      1    
5   2    3      0    
6   3    4      2

但是由于我有很多我想找到一种实现此目的的更简单方法。任何想法都会有所帮助:)

原文

I have a dataframe with unique values (df_values) that I want to subtract from all rows in a column of another dataframe (df)

>>> df_values
    Id  value  
0   1    2    
1   2    3    
2   3    2

I can do it by defining a function like this:

def conv(x, y, p):
    if y == 1:
        return x-p[0]
    elif y == 2:
        return x-p[1]
    elif y == 3:
        return x-p[2]

df['norm']=df.apply(lambda x : conv(x['T_air'], x['Id'],df_value['value']), axis=1)

So the result would be:

>>> df
    Id  T_air  norm
0   1    2      0
1   1    4      2
2   1    2      0
3   2    3      0
4   2    4      1    
5   2    3      0    
6   3    4      2

But since I have so many groupby items I would like to find a simpler way to achieve this.
Any Ideas would help :)

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

雨的味道风的声音 2025-02-03 17:00:37

使用使用代码> series.map ：

df['norm'] = df['T_air'].sub(df['Id'].map(df_value.set_index('Id')['value']))
print (df)
   Id  T_air  norm
0   1      2     0
1   1      4     2
2   1      2     0
3   2      3     0
4   2      4     1
5   2      3     0
6   3      4     2

Use Series.sub with mapping values by Series.map:

df['norm'] = df['T_air'].sub(df['Id'].map(df_value.set_index('Id')['value']))
print (df)
   Id  T_air  norm
0   1      2     0
1   1      4     2
2   1      2     0
3   2      3     0
4   2      4     1
5   2      3     0
6   3      4     2

回复收藏 0 原文

旧城空念 2025-02-03 17:00:37

您可以使用，您不需要groupby：

df['norm'] = df['T_air'] - df['Id'].map(df_values.set_index('Id')['value'])

输出：

   Id  T_air  norm
0   1      2     0
1   1      4     2
2   1      2     0
3   2      3     0
4   2      4     1
5   2      3     0
6   3      4     2

You can vectorize your by using map, you do not need to groupby:

df['norm'] = df['T_air'] - df['Id'].map(df_values.set_index('Id')['value'])

output:

   Id  T_air  norm
0   1      2     0
1   1      4     2
2   1      2     0
3   2      3     0
4   2      4     1
5   2      3     0
6   3      4     2

回复收藏 0 原文

~没有更多了~