从Python中的现有地图创建新地图

发布于 2025-02-10 07:06:03 字数 481 浏览 1 评论 0 原文

这个问题可能很常见,但我是Python的新手,想向社区学习更多。我有2个具有这样的数据映射的地图文件: MAP1:A - > b MAP2:B-> c,d,e

我想创建一个新的地图文件,该文件将为a - > c

在Python中实现这一目标的最有效方法是什么?通用方法将非常有用,因为我需要在不同的文件和不同的列上应用相同的逻辑

map1:

1,100
2,453
3,200

map2:

100,25,30,
200,300,,
250,190,20,1

我的map3应该是:

1,25
2,0
3,300

as 453 不存在于MAP2中,我们的Map3包含值 0 key 2

This question might be common but I am new to python and would like to learn more from the community. I have 2 map files which have data mapping like this:
map1 : A --> B
map2 : B --> C,D,E

I want to create a new map file which will be A --> C

What is the most efficient way to achieve this in python? A generic approach would be very helpful as I need to apply the same logic on different files and different columns

Example:

Map1:

1,100
2,453
3,200

Map2:

100,25,30,
200,300,,
250,190,20,1

My map3 should be:

1,25
2,0
3,300

As 453 is not present in map2, our map3 contains value 0 for key 2.

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

她如夕阳 2025-02-17 07:06:03

首先创建dataframes:

df1 = pd.read_csv(Map1, header=None)
df2 = pd.read_csv(Map2, header=None)

然后使用 按第二列与 df2 创建的series by serion>用第一列设置索引,最后替换丢失值为 0 不匹配值:

df1[1] = df1[1].map(df2.set_index(0)[1]).fillna(0, downcast='int')
print (df1)
   0    1
0  1   25
1  2    0
2  3  300

编辑:用于映射多个列,使用左JOIN与仅删除丢失的列, dataframe.dropna 和列 b,c 用于加入,最后替换缺失值:

df1.columns=['a','b']
df2.columns=['c','d','e','f']

df = (df1.merge(df2, how='left', left_on='b', right_on='c')
         .dropna(how='all', axis=1)
         .drop(['b','c'], axis=1)
         .fillna(0)
         .convert_dtypes())
print (df)
   a    d   e
0  1   25  30
1  2    0   0
2  3  300   0

First create DataFrames:

df1 = pd.read_csv(Map1, header=None)
df2 = pd.read_csv(Map2, header=None)

And then use Series.map by second column with by Series created by df2 with set index by first column, last replace missing values to 0 for not matched values:

df1[1] = df1[1].map(df2.set_index(0)[1]).fillna(0, downcast='int')
print (df1)
   0    1
0  1   25
1  2    0
2  3  300

EDIT: for mapping multiple columns use left join with remove only missing columns by DataFrame.dropna and columns b,c used for join, last replace missing values:

df1.columns=['a','b']
df2.columns=['c','d','e','f']

df = (df1.merge(df2, how='left', left_on='b', right_on='c')
         .dropna(how='all', axis=1)
         .drop(['b','c'], axis=1)
         .fillna(0)
         .convert_dtypes())
print (df)
   a    d   e
0  1   25  30
1  2    0   0
2  3  300   0
~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文