python读入csv后不能控制对应列的问题
import pandas as pd
reader=pd.read_csv('D:/scut_lastproject_dataset/august_week1_csv/uniq/augustweek1.csv',chunksize=1000,iterator=True)
file1 = reader.get_chunk(1000)
file1.columns=['souceip','sourceport','destport','protocol','flags','fwd','stos','pkt','byt','attack_type']
print(file1)
这里重新修改列名为10个
截图中选取了结果,实际上是有13列的,但读入之后size变成十列的了,但是数据还在却无法进行列名的修改
这是csv打开的截图,第二行的数据是无用的,不知道是不是有影响。因为数据集是30G的,所以删了再保存的话数据会丢失。所以该怎么办好,急急急!
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
你用read_csv的时候,加上skiprows 参数,要求忽略第二行就好了啊。