如何与相同值合并DF的行

发布于 2025-02-13 15:56:46 字数 1022 浏览 1 评论 0原文

我正在使用python上的熊猫面临问题，但我无法解决。我想合并/组合/重组具有相同URL的行。

编辑：我有一个像这样的数据框架：

url	col1	col2	col3	col4
aaA		xx	yy
bbb	zz
aaa	ee
				aa

我想要这样的东西：

url	col1 col1	col2	col2 col3	col3 col4
aaa aaa	aaa aaa ee	xx	yy
bbb	zz cc			cc cc
				cc aa

我尝试过使用Groupby，但是在我的df有没有URL的数据，我想保留它们。我还尝试过与内部合并，这给了我不错的结果，但是我不知道为什么它会破坏DF内部的行数。

谢谢。

原文

I am facing a problem using pandas on python and i can't solve it.
I would like to merge/combine/regroup the rows which have the same url.

EDIT :
I have a dataframe looking like this :

url	col1	col2	col3	col4
aaa		xx	yy
bbb	zz
aaa	ee
				AA

I would like something like this :

url	col1	col2	col3	col4
aaa	ee	xx	yy
bbb	zz			cc
				AA

I've tried using groupby, but in my df i've datas which don't have URL and i want to keep them.
I've also tried merge with inner, which gives me pretty good results but i don't know why it decuplates the number of rows inside my df.

thank you.

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

极度宠爱 2025-02-20 15:56:47

您可以使用groupby和first。

df = df.groupby('url', as_index=False).first()

You can use groupby and first.

df = df.groupby('url', as_index=False).first()

回复收藏 0 原文

暖阳 2025-02-20 15:56:47

我认为您应该使用Groupby，Nunique和NP.Where来解决此问题。
请参阅以下有关此问题的讨论。
pandas-dataframe-check-check-check-frame-check-if-multiple-multiple-multiple-lows-有个性值

回复收藏 0 原文

爱你是孤单的心事 2025-02-20 15:56:47

import pandas as pd
import numpy as np

df1 = pd.DataFrame({'url': ['url1', 'url2'], 'col1':['A', np.nan], 'col2':[np.nan, 'B']}).set_index('url')
df2 = pd.DataFrame({'url': ['url1', 'url2'], 'col1':[np.nan, 'C'], 'col2':['D', np.nan]}).set_index('url')
df1.fillna(df2, inplace=True)
print(df1)

结果：

     col1 col2
url           
url1    A    D
url2    C    B

import pandas as pd
import numpy as np

df1 = pd.DataFrame({'url': ['url1', 'url2'], 'col1':['A', np.nan], 'col2':[np.nan, 'B']}).set_index('url')
df2 = pd.DataFrame({'url': ['url1', 'url2'], 'col1':[np.nan, 'C'], 'col2':['D', np.nan]}).set_index('url')
df1.fillna(df2, inplace=True)
print(df1)

Result:

     col1 col2
url           
url1    A    D
url2    C    B

回复收藏 0 原文

~没有更多了~

关于作者

晨曦÷微暖

暂无简介

文章

26 人气

关注发私信

櫻之舞

文章 0 评论 0

关注

弥枳

文章 0 评论 0

关注

m2429

文章 0 评论 0

关注

寻找一个思念的角度

文章 0 评论 0

关注

野却迷人

文章 0 评论 0

关注

我怀念的。

文章 0 评论 0

友情链接

文江博客

如何与相同值合并DF的行

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（3）

关于作者

相关话题

热门标签

推荐作者

櫻之舞

弥枳

m2429

寻找一个思念的角度

野却迷人

我怀念的。

友情链接

如何与相同值合并DF的行

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（3）

关于作者

相关话题

热门标签

推荐作者

櫻之舞

弥枳

m2429

寻找一个思念的角度

野却迷人

我怀念的。

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。