python读写文件夹中编码方式各异的文件
现有需求如下:
遍历一个文件夹中的所有文件,读取文件内容,对文件内容进行处理后,重新写入文件中。
该文件夹下的文件编码方式不统一,例如下图所示:
图中,两个文件的编码,一个是ASCII
,另一个是ISO-8859
,且换行符还是CRLF风格的(该文件中包含了中文注释)
我尝试直接用utf-8编码方式读取文件:with open(file, encoding='utf-8') as f
,当读到那个272的file时,会报错:UnicodeDecodeError: 'utf-8' codec can't decode byte 0xbc in position 0: invalid start byte
也试过这样:with codecs.open(file, encoding='utf-8') as f
,但是仍然会报错。
请问有何好的处理办法?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(2)
二进制读取字节,然后根据不同的编码再处理
全部不加编码地读进来,然后判断编码,并转成 utf-8