Python Pandas:比较两列和返回字符串值,如果第一列包含字符中的字符

发布于 2025-02-14 01:52:39 字数 353 浏览 1 评论 0原文

我首先有2列,其中包括X或F在内的字符串,第二列为空。 如果第1列中有任何X 每次我运行代码时,都将值分配给所有这些

这个示例应该如何:

我的代码:

for row in df['Column2']:
    if df['Column1'].str.contains('X').any():
        df['Column2'] = 'YES'
    else:
        df['Column2'] = 'NO'

I have 2 columns first with string including X or F and second is empty.
If there is any X in column 1 I want to assign 'YES' to second column if there is no X assign 'NO'
Every time I run my code it is assigning value 'YES' to all of them

This example how it should look like:

My code:

for row in df['Column2']:
    if df['Column1'].str.contains('X').any():
        df['Column2'] = 'YES'
    else:
        df['Column2'] = 'NO'

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(2

人间不值得 2025-02-21 01:52:39

您每次通过循环执行矢量化操作。每次通过循环,您都将'是''分配给整个column2

使用numpy您可以做:

import numpy as np

df['Column2'] = np.where(df['Column1'].str.contains('X'), 'YES', 'NO')
print(df)

结果

             Column1 Column2
0  ....X.X.X.X..X.X.     YES
1  ....X.X.X.X..X.X.     YES
2  ....X.X.X.X..X.X.     YES
3  ....X.X.X.X..X.X.     YES
4          ....F.F.F‬      NO
5          ....F.F.F      NO
6          ....F.F.F      NO
7          ....F.F.F      NO

You are executing vectorized operation each time through the loop. Every time through the loop you are assigning 'YES' to the entire Column2.

Using numpy you could do:

import numpy as np

df['Column2'] = np.where(df['Column1'].str.contains('X'), 'YES', 'NO')
print(df)

Result

             Column1 Column2
0  ....X.X.X.X..X.X.     YES
1  ....X.X.X.X..X.X.     YES
2  ....X.X.X.X..X.X.     YES
3  ....X.X.X.X..X.X.     YES
4          ....F.F.F‬      NO
5          ....F.F.F      NO
6          ....F.F.F      NO
7          ....F.F.F      NO
时光病人 2025-02-21 01:52:39

您可以使用Regex查找“ X”,

if df['Column1'].str.find(r'X')>1:

甚至可以避免循环如下

(df['Column1'].str.find(r'X')>1).map({True: 'Yes', False: 'No'})

you can use regex to find 'X'

if df['Column1'].str.find(r'X')>1:

you can even avoid the loop as follows

(df['Column1'].str.find(r'X')>1).map({True: 'Yes', False: 'No'})

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文