模糊修复列表中基于列的正确值
我有一个脏数据框,如下所示
地区 |
---|
柏林 |
慕尼黑 |
柏林-斯潘道 |
施潘道-柏林 |
商店-慕尼黑 |
慕尼黑-休息 |
法兰克福 |
我也有包含干净信息的列表
城市 = ['柏林','慕尼黑','法兰克福']
我需要帮助在数据框中创建一个包含清洁城市的新列,如图所示
Region | Clean Region |
---|---|
Berlin | Berlin 德国 |
慕尼黑 | 慕尼黑 |
Berlin-Spandau | 柏林 |
Spandau-Berlin | Berlin |
商店-慕尼黑 | 慕尼黑 |
慕尼黑-休息 | 慕尼黑 |
法兰克福-pla | 法兰克福 |
我不知道如何创建这个专栏。需要 python 帮助
I have a dirty dataframe as shown below
Region |
---|
Berlin |
Munich |
Berlin-Spandau |
Spandau-Berlin |
Shop-Munich |
munich-rest |
Frankfurt |
I also have list with the clean information
city = ['Berlin','Munich','Frankfurt']
I need help creating a new column in the data frame with clean cities as shown
Region | Clean Region |
---|---|
Berlin | Berlin |
Munich | Munich |
Berlin-Spandau | Berlin |
Spandau-Berlin | Berlin |
Shop-Munich | Munich |
munich-rest | Munich |
Frankfurt-pla | Frankfurt |
I am not sure how to create this column. Need help in python
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(2)
您可以使用 lambda 函数。
You can use lambda function.
假设您从城市列表开始,您可以首先使用
.str.contains
查找每个单元格中包含哪个城市:现在,您可以使用
.melt
和然后.loc
将这些True
值转换为字符串,然后仅选择这些行:Assuming that you start from a list of cities, you could first use
.str.contains
to find which city is included in each cell:Now, you can use
.melt
and then.loc
to transform thoseTrue
values into a string and then select only those rows: