怎么判断python代码文件自身的编码类型?
比如,新建python代码文件file.py,
再file.py首行写:#coding=utf
这是指定file.py文件使用utf-8编码.
我的问题是:在file.py代码中,怎么使用代码获取到file.py文件自身的编码类型?
通常用两个方法也可以获取到,但我想问的是除此之外,还有更直接可靠的方法吗?
通常方法一:读取file.py文件的内容获取第一行内容,然后正则或者字符串判断.
通常方法二:读取file.py文件的内容,然后直接使用chardet模块来判断该内容的编码.
除了以上两个思路之外,python是否有内置方法或者模块来方便的获取到py代码文件自身的编码类型呢?
在pycharm中,这个ide是可以及时感知到首行设置的代码的(比如首行原来是#coding=u8,修改为#coding=gbk之后,pycharm自动尝试将当前编辑的py代码文件由utf-8编码转为gbk编码),不知道pycharm是怎么做的?
多谢!
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
不答问题,墨迹两句:
讲道理的话,文件的编码和 coding=utf-8 没有关系,文件到底被按什么编码了,不受这句 comment 的约束
计算机保存的的只是01,只是你用什么格式去解码而已。chardet 应该是尽量试,哪种错的少就猜是哪种
没用过 pycharm,不过我猜 pycharm 是搞系统编码格式或者你设置的。