在通过另一列中的唯一ID分组时,如何在数据框列的上一行中比较名称?

发布于 2025-02-06 14:02:40 字数 1962 浏览 0 评论 0原文

我有下表:

唯一ID名称
111Mayank
111Mayanak
222Leddie。
222Leddie Chan
333May Bou Karam
333May Bou Karam

我试图将“名称”列中的每一行与以前的列进行比较,同时按唯一ID进行分组。期望输出类似:

唯一的ID名称2分数
111MayankMayanak67
111MayanakNan67
222Leddie。Leddie Chan90
222Leddie ChanNan90
333May Bou KaramMay Bou Karam90
333May Bou KaramNan33

我使用以下代码来评估与下一行相比的一排的得分按唯一ID进行分组:

df['Name2'] = df['Name'].shift(-1)
df['Score'] = df.apply(lambda x: fuzz.partial_ratio(x['Name'], x['Name2']), axis=1)

我将获得以下输出:

唯一ID名称2分数
111MayankMayanak67
111MayanakLeddie。0
222LEDDIE。Leddie Chan100
222Leddie ChanMay Bou Karam18
333May Bou KaramMay Bou Karam90
333May Bou KaramNan33

我尚未与使用Fuzz.partial_ratio结婚。如果有更好的方法可以匹配字符串,我会为此而成为游戏。

另外,我意识到Name2列不是必需的,但是我创建了它,以确保我的每个步骤正确。很抱歉,如果令人困惑。任何帮助和反馈将不胜感激。谢谢。

I have the following table:

Unique IDName
111Mayank
111Mayanak
222Leddie .
222Leddie Chan
333May BOU KARAM
333May Bou Karam

I'm trying to compare each row in the 'Name' column to its previous column while grouping by Unique ID. Expecting an output similar to:

Unique IDNameName2Score
111MayankMayanak67
111Mayanaknan67
222Leddie .Leddie Chan90
222Leddie Channan90
333May BOU KARAMMay Bou Karam90
333May Bou Karamnan33

I've used the following code to evaluate the score of one row compared to its next row but I can't figure out how to group it by the Unique ID:

df['Name2'] = df['Name'].shift(-1)
df['Score'] = df.apply(lambda x: fuzz.partial_ratio(x['Name'], x['Name2']), axis=1)

I get the following output:

Unique IDNameName2Score
111MayankMayanak67
111MayanakLeddie .0
222Leddie .Leddie Chan100
222Leddie ChanMay BOU KARAM18
333May BOU KARAMMay Bou Karam90
333May Bou Karamnan33

I'm not married to using fuzz.partial_ratio to match the strings. If there's a better way to match the strings, I'd be game for that.

Also, I realise that the Name2 column is not necessary, but I created it to make sure I'm getting each step right. Apologies if it's confusing. Any help and feedback would be greatly appreciated. Thank you.

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。
列表为空,暂无数据
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文