- 译者序
- 前言
- 第1章 问答环节
- 第2章 Python 如何运行程序
- 第3章 如何运行程序
- 第4章 介绍 Python 对象类型
- 第5章 数字
- 第6章 动态类型简介
- 第7章 字符串
- 第8章 列表与字典
- 第9章 元组、文件及其他
- 第10章 Python 语句简介
- 第11章 赋值、表达式和打印
- 第12章 if 测试和语法规则
- 第13章 while 和 for 循环
- 第14章 迭代器和解析,第一部分
- 第15章 文档
- 第16章 函数基础
- 第17章 作用域
- 第18章 参数
- 第19章 函数的高级话题
- 第20章 迭代和解析,第二部分
- 第21章 模块:宏伟蓝图
- 第22章 模块代码编写基础
- 第23章 模块包
- 第24章 高级模块话题
- 第25章 OOP:宏伟蓝图
- 第27章 更多实例
- 第28章 类代码编写细节
- 第29章 运算符重载
- 第30章 类的设计
- 第31章 类的高级主题
- 第32章 异常基础
- 第34章 异常对象
- 第35章 异常的设计
- 第36章 Unicode 和字节字符串
- 字符串基础知识
- Python 的字符串类型
- 文本和二进制文件
- Python 3.0 中的字符串应用
- 转换
- 编码 Unicode 字符串
- 编码非ASCII文本
- 编码和解码非ASCII文本
- 其他 Unicode 编码技术
- 转换编码
- 在 Python 2.6 中编码 Unicode 字符串
- 源文件字符集编码声明
- 使用 Python 3.0 Bytes 对象
- 序列操作
- 创建 bytes 对象的其他方式
- 混合字符串类型
- 使用 Python 3.0(和 Python 2.6)bytearray 对象
- 使用文本文件和二进制文件
- Python 3.0 中的文本和二进制模式
- 类型和内容错误匹配
- 使用 Unicode 文件
- 在 Python 3.0 中处理 BOM
- Python 2.6 中的 Unicode 文件
- Python 3.0 中其他字符串工具的变化
- Struct二进制数据模块
- pickle对象序列化模块
- XML解析工具
- 本章小结
- 本章习题
- 习题解答
- 第37章 管理属性
- 第38章 装饰器
- 第39章 元类
- 附录A 安装和配置
- 附录B 各部分练习题的解答
- 作者介绍
- 封面介绍
使用 Unicode 文件
在Python 3.0中读取和写入Unicode
实际上,我们有两种办法可以把字符串转换为不同的编码:用方法调用手动地转换和在文件输入输出上自动地转换。在本节中,我们将使用如下的Unicode字符串来说明这一点:
手动编码
我们已经介绍过,总是可以根据目标编码名称把一个字符串转换为raw bytes:
文件输出编码
现在,要把我们的字符串以特定编码写入一个文本文件,我们可以直接把想要的编码名称传递给open,尽管我们可以先手动地编码并以二进制格式写入,但没有必要这么做:
文件输入编码
类似地,要读取任意的Unicode数据,我们直接把文件的编码类型名称传入open,并且,它自动根据raw bytes解码出字符串;我们也可以手动地读取raw byte并解码,但是,当读取数据块的时候(我们可能读取不完整的字符),这可能有些繁琐,并且也没有必要这么做:
解码错误匹配
最后,别忘了,Python 3.0中的这些文件行为仅限于可以作为文本载入的内容。正如前面的部分所介绍的,Python 3.0真的必须能够把文本文件中的数据解码为一个str字符串,根据默认的或传入的Unicode编码名称。例如,试图以文本模式打开一个真正的二进制数据文件,即便使用了正确的对象类型,也不可能在Python 3.0中有效。
这些例子中的第一个可能不会在Python 2.X中失效(常规文件不能解码文本),即便它可能应该失效:读取一个文件可能会以字符串返回毁坏的数据,由于在文本模式中的自动行末转换(读取的时候,任何嵌入的\r\n字节都将在Windows下转换为\n)。在Python 2.6中,要把文件内容当做Unicode文本对待,我们需要使用特殊的工具而不是通用的内置函数open,稍后我们将介绍这些。那么,首先,让我们来看一个更重要的话题。
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论