pandas csv追加写入的问题
1,今天遇到一个比较棘手的问题,磁盘分区是ntfs格式的不存在4G上限问题,可是用pandas的to_csv的时候就遇到了问题,文件大小总是在4G刚刚出头。
2,具体的错误信息
IOError: [Errno 22] invalid mode ('a+') or filename: 'C:\Users......'
非常纳闷,找了很长时间的答案也没找到,想问下pandas的csv文件追加写入是不是有4g上限这个标准,或者是我的win7系统问题?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(3)
可能是内存超出了。to_csv可以设置chunksize每次写入多少行数据,如:
做一个循环,每次写10000行,应该不会有问题。
昨天晚上把样本在32G内存的主机上跑了一下,2个4g的文件一次读入,然后pd.concat可以写出哦,看来应该不存在4g上限问题。
根据错误信息
IOError: [Errno 22] invalid mode ('a+') or filename: 'C:Users......'
你这个路径不对啊
C:Users