减去熊猫中每个组项目的独特价值

发布于 2025-01-27 17:00:37 字数 866 浏览 2 评论 0原文

我有一个具有唯一值(DF_VALUES)的数据框,我想在另一个dataframe(df)的一列中从所有行中减去

>>> df_values
    Id  value  
0   1    2    
1   2    3    
2   3    2       
>>> df
    Id  T_air  
0   1    2    
1   1    4    
2   1    2    
3   2    3
4   2    4    
5   2    3    
6   3    4     

我可以通过定义这样的函数来做到这一点:

def conv(x, y, p):
    if y == 1:
        return x-p[0]
    elif y == 2:
        return x-p[1]
    elif y == 3:
        return x-p[2]

df['norm']=df.apply(lambda x : conv(x['T_air'], x['Id'],df_value['value']), axis=1)

因此,结果是:

>>> df
    Id  T_air  norm
0   1    2      0
1   1    4      2
2   1    2      0
3   2    3      0
4   2    4      1    
5   2    3      0    
6   3    4      2     

但是由于我有很多我想找到一种实现此目的的更简单方法。 任何想法都会有所帮助:)

I have a dataframe with unique values (df_values) that I want to subtract from all rows in a column of another dataframe (df)

>>> df_values
    Id  value  
0   1    2    
1   2    3    
2   3    2       
>>> df
    Id  T_air  
0   1    2    
1   1    4    
2   1    2    
3   2    3
4   2    4    
5   2    3    
6   3    4     

I can do it by defining a function like this:

def conv(x, y, p):
    if y == 1:
        return x-p[0]
    elif y == 2:
        return x-p[1]
    elif y == 3:
        return x-p[2]

df['norm']=df.apply(lambda x : conv(x['T_air'], x['Id'],df_value['value']), axis=1)

So the result would be:

>>> df
    Id  T_air  norm
0   1    2      0
1   1    4      2
2   1    2      0
3   2    3      0
4   2    4      1    
5   2    3      0    
6   3    4      2     

But since I have so many groupby items I would like to find a simpler way to achieve this.
Any Ideas would help :)

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(2

雨的味道风的声音 2025-02-03 17:00:37

使用 使用代码> series.map

df['norm'] = df['T_air'].sub(df['Id'].map(df_value.set_index('Id')['value']))
print (df)
   Id  T_air  norm
0   1      2     0
1   1      4     2
2   1      2     0
3   2      3     0
4   2      4     1
5   2      3     0
6   3      4     2

Use Series.sub with mapping values by Series.map:

df['norm'] = df['T_air'].sub(df['Id'].map(df_value.set_index('Id')['value']))
print (df)
   Id  T_air  norm
0   1      2     0
1   1      4     2
2   1      2     0
3   2      3     0
4   2      4     1
5   2      3     0
6   3      4     2
旧城空念 2025-02-03 17:00:37

您可以使用 ,您不需要groupby

df['norm'] = df['T_air'] - df['Id'].map(df_values.set_index('Id')['value'])

输出:

   Id  T_air  norm
0   1      2     0
1   1      4     2
2   1      2     0
3   2      3     0
4   2      4     1
5   2      3     0
6   3      4     2

You can vectorize your by using map, you do not need to groupby:

df['norm'] = df['T_air'] - df['Id'].map(df_values.set_index('Id')['value'])

output:

   Id  T_air  norm
0   1      2     0
1   1      4     2
2   1      2     0
3   2      3     0
4   2      4     1
5   2      3     0
6   3      4     2
~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文