- 译者序
- 前言
- 第1章 问答环节
- 第2章 Python 如何运行程序
- 第3章 如何运行程序
- 第4章 介绍 Python 对象类型
- 第5章 数字
- 第6章 动态类型简介
- 第7章 字符串
- 第8章 列表与字典
- 第9章 元组、文件及其他
- 第10章 Python 语句简介
- 第11章 赋值、表达式和打印
- 第12章 if 测试和语法规则
- 第13章 while 和 for 循环
- 第14章 迭代器和解析,第一部分
- 第15章 文档
- 第16章 函数基础
- 第17章 作用域
- 第18章 参数
- 第19章 函数的高级话题
- 第20章 迭代和解析,第二部分
- 第21章 模块:宏伟蓝图
- 第22章 模块代码编写基础
- 第23章 模块包
- 第24章 高级模块话题
- 第25章 OOP:宏伟蓝图
- 第27章 更多实例
- 第28章 类代码编写细节
- 第29章 运算符重载
- 第30章 类的设计
- 第31章 类的高级主题
- 第32章 异常基础
- 第34章 异常对象
- 第35章 异常的设计
- 第36章 Unicode 和字节字符串
- 字符串基础知识
- Python 的字符串类型
- 文本和二进制文件
- Python 3.0 中的字符串应用
- 转换
- 编码 Unicode 字符串
- 编码非ASCII文本
- 编码和解码非ASCII文本
- 其他 Unicode 编码技术
- 转换编码
- 在 Python 2.6 中编码 Unicode 字符串
- 源文件字符集编码声明
- 使用 Python 3.0 Bytes 对象
- 序列操作
- 创建 bytes 对象的其他方式
- 混合字符串类型
- 使用 Python 3.0(和 Python 2.6)bytearray 对象
- 使用文本文件和二进制文件
- Python 3.0 中的文本和二进制模式
- 类型和内容错误匹配
- 使用 Unicode 文件
- 在 Python 3.0 中处理 BOM
- Python 2.6 中的 Unicode 文件
- Python 3.0 中其他字符串工具的变化
- Struct二进制数据模块
- pickle对象序列化模块
- XML解析工具
- 本章小结
- 本章习题
- 习题解答
- 第37章 管理属性
- 第38章 装饰器
- 第39章 元类
- 附录A 安装和配置
- 附录B 各部分练习题的解答
- 作者介绍
- 封面介绍
在 Python 3.0 中处理 BOM
例如,当我们把一个文本文件保存到Windows Notepad中的时候,可以在一个下拉列表中指定其编码类型——简单的ASCII文本、UTF-8或者小尾或大尾的UTF-16。例如,如果一个单行的、名为spam.txt的文本文件在Notepad中按照编码类型"ANSI"保存,它会编写为一个简单的ASCII文件而没有一个BOM。当这个文件在Python中以二进制模式读取的时候,我们可以看到存储在文件中的真正的bytes。当它作为文本读取的时候,Python默认会执行行尾转换,既然ASCII是UTF-8的一个子集(并且UTF-8是Python 3.0的默认编码),我们可以将其显式地解码为UTF-8文本:
如果文件在Notepad中保存为"UTF-8",预先使用一个3字节UTF-8 BOM序列,并且我们需要给出更多具体编码名称("utf-8-sig")来迫使Python跳过标记:
如果文件作为“Unicode大尾”存储在Notepad中,我们得到了文件中的UTF-16格式的数据,预先使用一个两字节的BOM序列——在Python中,编码名"utf-16"忽略BOM,因为它是暗示的(因为所有的UTF-16文件都有一个BOM),并且"utf-16-be"处理大尾格式但不会忽略BOM:
对于输出通常也是这样。当用Python代码写入一个Unicode文件,我们需要一个更加显式的编码名称来强迫UTF-8中带有BOM——"utf-8"不会写入(或忽略)BOM,但"utf-8-sig"会这么做:
注意,尽管"utf-8"没有抛弃BOM,但不带BOM的数据可以用"utf-8"和"utf-8-sig"读取——如果你不确定一个文件中是否有BOM,使用后者进行输入(在机场安全检测线上,不要大声读出这一段):
最后,对于编码名"utf-16",BOM自动处理:在输出上,数据以平台本地的大小尾方式写入,并且,BOM总是会写的;在输入上,数据根据每个BOM解码,并且BOM总是会去除掉。更具体的UTF-16编码名称可以指定不同的大小尾,尽管在某些情况下如果需要或显示BOM的话,我们必须自己手动地编写和略过BOM:
更具体的UTF-16编码名称对于缺乏BOM的文件都工作得很好,尽管"utf-16"在输入时需要一个BOM以便确定字节顺序:
自己尝试实验这些编码,或者查看Python的库手册,以了解关于BOM的更多细节。
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论