如何使用最近的时间到另一个数据框?
对于这个项目,我有两个数据范围,一个称为 df1 ,另一个称为 df2 。这些数据范围的大小不是相同的(不要认为这很重要)。
他们每个人在第一列中都有 datetime 。我要做的是:
我想制作一个新的dataframe df3 ,其中包含 df2 的剩余数据,但仅用于第一列中的原始时间最接近 df1 。
以下是数据框的外观示例:
print (df1)
Output:
Date Val
0 2015-02-24 00:00:02 1.764052
1 2015-02-24 00:01:15 0.400157
2 2015-02-24 00:02:22 0.978738
3 2015-02-24 00:03:39 2.240893
4 2015-02-24 00:04:00 1.867558
print (df2)
Output:
Date Val Name
0 2015-02-24 00:00:00 -0.977278 John
1 2015-02-24 00:01:00 0.950088 Robert
2 2015-02-24 00:02:00 -0.103219 Sam
3 2015-02-24 00:03:00 0.151357 Tim
4 2015-02-24 00:04:00 0.410599 Hector
5 2015-02-24 00:05:00 0.673247 Melissa
那么我想要检索的内容就是这样:
print (df2)
Output:
Date Val Name
0 2015-02-24 00:00:00 -0.977278 John
1 2015-02-24 00:01:00 0.950088 Robert
2 2015-02-24 00:02:00 -0.103219 Sam
3 2015-02-24 00:04:00 0.410599 Hector
4 2015-02-24 00:04:00 0.410599 Hector
5 2015-02-24 00:05:00 0.673247 Melissa
我已经搜索了一些搜索,发现这里有两个类似的帖子 example-1 example-2 ,但是区别在于他们只需要返回单个值或单个行。出于我的目的,我希望它可以“过滤”。
如果有人能提供任何见解,这将不胜感激,谢谢。
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
data:image/s3,"s3://crabby-images/d5906/d59060df4059a6cc364216c4d63ceec29ef7fe66" alt="扫码二维码加入Web技术交流群"
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
如果我正确理解,我相信这会给您您想要的东西。
第一行刚刚在
df2
中找到该行,该行与df1
中的每一行最接近,并将索引作为列作为列以df1
之类的列附加。然后,第二行只需子集
df2
带有索引列。最终输出是If I understand correctly, I believe this gives you what you're looking for.
The first line just finds the row in
df2
that is closest to each row indf1
and appends the indices as a column todf1
like this:The second row then just subsets
df2
with the column of indices. The final output is