文章来源于网络收集而来,版权归原创者所有,如有侵权请及时联系!
3.实验方法与步骤
实验一
1)打开Python载入Pandas库,使用read_excel()函数将“test/data/water_heater.xls”数据读入到Python中。water_heater.xls文件中的数据形式如表10-4所示,数据为热水器用户一个月左右的用水数据,数据量为2万行左右。
2)利用Pandas的函数和方法,得到用水事件的序号、事件起始数据编号、事件终止数据编号,其中用水事件的序号为一个连续编号(1,2,3……)。根据水流量的值是否为0,明确地确定用户是否在用热水。再根据各条数据的发生时间,如果停顿时间超过阈值4分钟,则认为是2次用水事件。算法具体步骤可参考10.2.3节的数据变换中一次完整用水事件的划分模型,也可根据自己理解编写。
3)使用to_excel()函数将得到用水事件序号、事件起始数据编号和事件终止数据编号等,划分结果保存到Excel文件中。
实验二
1)打开Python载入Pandas,使用read_excel()函数将“test/data/water_heater.xls”数据读入到Python中,并将“实验一”中得到的划分结果读入到Python中。
2)数据转换,属性提取。用水事件时长,根据事件终止数据时间点减去事件起始数据时间点得到。再得到一次用水事件中开关机切换次数、一次用水事件的总用水量、平均水流量等属性。这些属性的提取方法见表10-11~表10-20。
3)用to_excel()函数将每个用水事件的基本信息与提取得到的属性保存到Excel文件中。
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论