对时间序列数据 pandas 进行重采样
我有一个每 10 分钟划分一次的 csv 文件,它告诉我每条线路的乘客数量,但是我有一个从下午 1 点到 4:50 的间隙,它没有注册,我怎样才能用乘客数量 0 来填充它
I have a csv file divided every 10 minutes that informs me of the number of passengers per line, but I have a gap from 1 pm to 4:50 it does not have a registration, how can I fill it with the number of passengers 0
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
您可以使用
pd.date_range
创建日期:关键字参数
inclusive
从 1.4.0 及更高版本开始可用。对于以前的版本,您必须在start_date
中添加 10 分钟,并在end_date
中减去相同的时间量,因为默认情况下这两个值都会包含在您的日期范围内:现在您可以使用新行创建数据框并使用
.concat
包含原始数据:You could create a new dataframe with the dates and number of passengers you want by using
pd.date_range
to create the dates:The keyword argument
inclusive
is available from 1.4.0 and forward. For previous versions, you'll have to add the 10 minutes tostart_date
and subtract the same time amount toend_date
, since both values would be included by default in your date range:Now you can create your dataframe with the new rows and use
.concat
to include your original data: