译者序
前言
- 关于第4版
- 新增章
- 已有内容的修改
- Python 2.6 和 Python 3.0 中的特定语言扩展
- Python 3.0 中特定的语言删除
- 关于本书
- 本书的范围和其他书籍
- 本书的风格和结构
- 书籍更新
- 关于本书的程序
- 使用代码示例
- 体例
- 联系我们
- 致谢
第1章问答环节
- 开发效率
- Python 是脚本语言吗？
- 好吧 Python 的缺点是什么呢？
- 如今谁在使用 Python
- 使用 Python 可以做些什么
- 用户图形接口
- Internet 脚本
- 组件集成
- 数据库编程
- 快速原型
- 数值计算和科学计算编程
- 游戏、图像、人工智能、XML、机器人等
- Python 如何获得支持
- Python 有哪些技术上的优点
- 免费
- 可移植
- 功能强大
- 可混合
- 简单易用
- 简单易学
- Python 和其他语言比较起来怎么样
- 本章小结
- 本章习题
- 习题解答
第2章 Python 如何运行程序
- 程序执行
- Python 的视角
- 执行模块的变体
- 执行优化工具
- 冻结二进制文件
- 其他执行选项
- 未来的可能性
- 本章小结
- 本章习题
- 习题解答
第3章如何运行程序
- 为什么使用交互提示模式
- 使用交互提示模式
- 系统命令行和文件
- 使用命令行运行文件
- 使用命令行和文件
- UNIX 可执行脚本
- 点击文件图标
- input 的技巧
- 图标点击的其他限制
- 模块导入和重载
- import 和 reload 的使用注意事项
- 使用exec运行模块文件
- IDLE 用户界面
- 使用 IDLE
- 高级 IDLE 工具
- 其他的 IDE
- 其他启动选项
- 冻结二进制的可执行性
- 文本编辑器启动的选择
- 其他的启动选择
- 未来的可能
- 我应该选用哪种
- 本章小结
- 本章习题
- 习题解答
- 第一部分练习题
第4章介绍 Python 对象类型
- 数字
- 字符串
- 不可变性
- 类型特定的方法
- 寻求帮助
- 编写字符串的其他方法
- 模式匹配
- 列表
- 类型特定的操作
- 边界检查
- 嵌套
- 列表解析
- 字典
- 重访嵌套
- 键的排序：for 循环
- 迭代和优化
- 不存在的键：if 测试
- 元组
- 文件
- 其他核心类型
- 用户定义的类
- 剩余的内容
- 本章小结
- 本章习题
- 习题解答
第5章数字
- 内置数学工具和扩展
- Python 表达式操作符
- 在实际应用中的数字
- 数字显示的格式
- 比较：一般的和连续的
- 除法：传统除法、Floor 除法和真除法
- 整数精度
- 复数
- 十六进制、八进制和二进制记数
- 位操作
- 其他的内置数学工具
- 其他数字类型
- 分数类型
- 集合
- 布尔型
- 数字扩展
- 本章小结
- 本章习题
- 习题解答
第6章动态类型简介
- 类型属于对象，而不是变量
- 对象的垃圾收集
- 共享引用
- 共享引用和相等
- 动态类型随处可见
- 本章小结
- 本章习题
- 习题解答
第7章字符串
- 用转义序列代表特殊字节
- raw字符串抑制转义
- 三重引号编写多行字符串块
- 实际应用中的字符串
- 索引和分片
- 字符串转换工具
- 修改字符串
- 字符串方法
- 字符串方法实例：文本解析
- 实际应用中的其他常见字符串方法
- 最初的字符串模块（在 Python 3.0 中删除）
- 字符串格式化表达式
- 基于字典的字符串格式化
- 字符串格式化调用方法
- 添加键、属性和偏移量
- 添加具体格式化
- 与%格式化表达式比较
- 为什么用新的格式化方法
- 通常意义下的类型分类
- 可变类型能够在原处修改
- 本章小结
- 本章习题
- 习题解答
第8章列表与字典
- 实际应用中的列表
- 列表迭代和解析
- 索引、分片和矩阵
- 原处修改列表
- 字典
- 实际应用中的字典
- 原处修改字典
- 其他字典方法
- 语言表
- 字典用法注意事项
- 创建字典的其他方法
- Python 3.0 中的字典变化
- 本章小结
- 本章习题
- 习题解答
第9章元组、文件及其他
- 为什么有了列表还要元组
- 文件
- 使用文件
- 实际应用中的文件
- 其他文件工具
- 重访类型分类
- 对象灵活性
- 引用VS拷贝
- 比较、相等性和真值
- Python 中真和假的含义
- Python 的类型层次
- Type 对象
- Python 中的其他类型
- 赋值生成引用，而不是拷贝
- 重复能够增加层次深度
- 留意循环数据结构
- 不可变类型不可以在原处改变
- 本章小结
- 本章习题
- 习题解答
- 第二部分练习题
第10章 Python 语句简介
- 两个 if 的故事
- Python 删除了什么
- 为什么使用缩进语法
- 几个特殊实例
- 简短实例：交互循环
- 对用户输入数据做数学运算
- 用测试输入数据来处理错误
- 用try语句处理错误
- 嵌套代码三层
- 本章小结
- 本章习题
- 习题解答
第11章赋值、表达式和打印
- 序列赋值
- Python 3.0 中的扩展序列解包
- 多目标赋值语句
- 增强赋值语句
- 变量命名规则
- 表达式语句
- 打印操作
- Python 2.6 print 语句
- 打印流重定向
- 版本独立的打印
- 本章小结
- 本章习题
- 习题解答
第12章 if 测试和语法规则
- 基本例子
- 多路分支
- Python 语法规则
- 语句的分隔符
- 一些特殊情况
- 真值测试
- if/else 三元表达式
- 本章小结
- 本章习题
- 习题解答
第13章 while 和 for 循环
- 例子
- break、continue、pass 和循环 else
- 一般循环格式
- pass
- continue
- break
- 循环else
- for循环
- 一般格式
- 例子
- 编写循环的技巧
- 非完备遍历：range 和分片
- 修改列表：range
- 并行遍历：zip 和 map
- 产生偏移和元素：enumerate
- 本章小结
- 本章习题
- 习题解答
第14章迭代器和解析，第一部分
- 手动迭代：iter 和 next
- 其他内置类型迭代器
- 列表解析：初探
- 在文件上使用列表解析
- 扩展的列表解析语法
- 其他迭代环境
- Python 3.0 中的新的可迭代对象
- map、zip 和 filter 迭代器
- 多个迭代器 VS 单个迭代器
- 字典视图迭代器
- 其他迭代器主题
- 本章小结
- 本章习题
- 习题解答
第15章文档
- dir 函数
- 文档字符串：doc
- PyDoc：help 函数
- PyDoc：HTML 报表
- 标准手册集
- 网络资源
- 已出版的书籍
- 常见编写代码的陷阱
- 本章小结
- 本章习题
- 习题解答
- 第三部分练习题
第16章函数基础
- 编写函数
- def 语句是实时执行的
- 第一个例子：定义和调用
- 调用
- Python 中的多态
- 第二个例子：寻找序列的交集
- 调用
- 重访多态
- 本地变量
- 本章小结
- 本章习题
- 习题解答
第17章作用域
- 变量名解析：LEGB 原则
- 作用域实例
- 内置作用域
- global 语句
- 最小化文件间的修改
- 其他访问全局变量的方法
- 作用域和嵌套函数
- 嵌套作用域举例
- nonlocal 语句
- nonlocal 应用
- 为什么使用 nonlocal
- 本章小结
- 本章习题
- 习题解答
第18章参数
- 避免可变参数的修改
- 对参数输出进行模拟
- 特定的参数匹配模型
- 匹配语法
- 细节
- 关键字参数和默认参数的实例
- 任意参数的实例
- Python 3.0 Keyword-Only 参数
- min调用
- 满分
- 加分点
- 结论
- 一个更有用的例子：通用 set 函数
- 模拟 Python 3.0 print 函数
- 本章小结
- 本章习题
- 习题解答
第19章函数的高级话题
- 递归函数
- 编码替代方案
- 循环语句VS递归
- 处理任意结构
- 函数对象：属性和注解
- 函数内省
- 函数属性
- Python 3.0 中的函数注解
- 匿名函数：lambda
- 为什么使用 lambda
- 如何（不要）让 Python 代码变得晦涩难懂
- 嵌套lambda和作用域
- 在序列中映射函数：map
- 函数式编程工具：filter 和 reduce
- 本章小结
- 本章习题
- 习题解答
第20章迭代和解析，第二部分
- 增加测试和嵌套循环
- 列表解析和矩阵
- 理解列表解析
- 重访迭代器：生成器
- 生成器表达式：迭代器遇到列表解析
- 生成器函数 VS 生成器表达式
- 生成器是单迭代器对象
- 用迭代工具模拟 zip 和 map
- 内置类型和类中的值生成
- Python 3.0 解析语法概括
- 针对集合和字典的扩展的解析语法
- 对迭代的各种方法进行计时
- 计时脚本
- 计时结果
- 计时模块替代方案
- 其他建议
- 函数陷阱
- 默认和可变对象
- 没有 return 语句的函数
- 嵌套作用域的循环变量
- 本章小结
- 本章习题
- 习题解答
- 第四部分练习题
第21章模块：宏伟蓝图
- Python程序架构
- 导入和属性
- 标准库模块
- import 如何工作
- 2.编译（可选）
- 3.运行
- 模块搜索路径
- 搜索路径的变动
- sys.path 列表
- 模块文件选择
- 高级的模块选择概念
- 本章小结
- 本章习题
- 习题解答
第22章模块代码编写基础
- 模块的使用
- from 语句
- from* 语句
- 导入只发生一次
- import 和 from 是赋值语句
- 文件间变量名的改变
- import 和 from 的对等性
- from语句潜在的陷阱
- 模块命名空间
- 属性名的点号运算
- 导入和作用域
- 命名空间的嵌套
- 重载模块
- reload 实例
- 本章小结
- 本章习题
- 习题解答
第23章模块包
- init.py 包文件
- 包导入实例
- 为什么要使用包导入
- 包相对导入
- 相对导入基础知识
- 为什么使用相对导入
- 相对导入的作用域
- 模块查找规则总结
- 相对导入的应用
- 本章小结
- 本章习题
- 习题解答
第24章高级模块话题
- 启用以后的语言特性
- 混合用法模式：name 和 main
- 使用带有 name 的命令行参数
- 修改模块搜索路径
- Import 语句和 from 语句的 as 扩展
- 模块是对象：元程序
- 用名称字符串导入模块
- 过渡性模块重载
- 模块设计理念
- 模块陷阱
- from 复制变量名，而不是连接
- from* 会让变量语义模糊
- reload 不会影响 from 导入
- reload、from 以及交互模式测试
- 递归形式的 from 导入无法工作
- 本章小结
- 本章习题
- 习题解答
- 第五部分练习题
第25章 OOP：宏伟蓝图
- 概览OOP
- 类和实例
- 类方法调用
- 编写类树
- OOP 是为了代码重用
- 本章小结
- 本章习题
- 习题解答
- 第26章类代码编写基础
- 实例对象是具体的元素
- 第一个例子
- 类通过继承进行定制
- 类是模块内的属性
- 类可以截获 Python 运算符
- 为什么要使用运算符重载
- 世界上最简单的 Python 类
- 本章小结
- 本章习题
- 习题解答
第27章更多实例
- 在进行中测试
- 以两种方式使用代码
- 步骤2：添加行为方法
- 步骤3：运算符重载
- 步骤4：通过子类定制行为
- 扩展方法：不好的方式
- 扩展方法：好的方式
- 多态的作用
- 继承、定制和扩展
- OOP：大思路
- 步骤5：定制构造函数
- 组合类的其他方式
- 步骤6：使用内省工具
- 一种通用显示工具
- 实例与类属性的关系
- 工具类的命名考虑
- 类的最终形式
- 步骤7（最后一步）：把对象存储到数据库中
- 在 shelve 数据库中存储对象
- 交互地探索 shelve
- 更新 shelve 中的对象
- 未来方向
- 本章小结
- 本章习题
- 习题解答
第28章类代码编写细节
- 例子
- 方法
- 调用超类构造函数
- 其他方法调用的可能性
- 继承
- 继承方法的专有化
- 类接口技术
- 抽象超类
- Python 2.6 和 Python 3.0 的抽象超类
- 命名空间：完整的内容
- 属性名称：对象命名空间
- Python 命名空间的禅：赋值将变量名分类
- 命名空间字典
- 命名空间链接
- 回顾文档字符串
- 类与模块的关系
- 本章小结
- 本章习题
- 习题解答
第29章运算符重载
- 常见的运算符重载方法
- 索引和分片：getitem 和 setitem
- 索引迭代：getitem
- 迭代器对象：iter 和 next
- 有多个迭代器的对象
- 成员关系：contains、iter 和 getitem
- 属性引用：getattr 和 setattr
- 模拟实例属性的私有性：第一部分
- repr 和 str 会返回字符串表达形式
- 右侧加法和原处加法：radd 和 iadd
- Call表达式：call
- 比较：lt、gt 和其他方法
- 布尔测试：bool 和 len
- 对象析构函数：del
- 本章小结
- 本章习题
- 习题解答
第30章类的设计
- OOP和继承：是一个关系
- OOP和组合：有一个关系
- OOP和委托：包装对象
- 类的伪私有属性
- 为什么使用伪私有属性
- 方法是对象：绑定或无绑定
- 绑定方法和其他可调用对象
- 多重继承：混合类
- 类是对象：通用对象的工厂
- 与设计相关的其他话题
- 本章小结
- 本章习题
- 习题解答
第31章类的高级主题
- 通过子类扩展类型
- 新式类
- 新式类变化
- 钻石继承变动
- 新式类的扩展
- 类特性
- getattribute 和描述符
- 元类
- 静态方法和类方法
- Python 2.6 和 Python 3.0 中的静态方法
- 静态方法替代方案
- 使用静态和类方法
- 使用静态方法统计实例
- 用类方法统计实例
- 装饰器和元类：第一部分
- 装饰器例子
- 类装饰器和元类
- 更多详细信息
- 类陷阱
- 修改可变的类属性也可能产生副作用
- 多重继承：顺序很重要
- 类、方法以及嵌套作用域
- Python 中基于委托的类：getattr 和内置函数
- 过度包装
- 本章小结
- 本章习题
- 习题解答
- 第六部分练习题
第32章异常基础
- 异常处理：简明扼要
- 捕获异常
- 引发异常
- 用户定义的异常
- 终止行为
- 本章小结
- 本章习题
- 习题解答
- 第33章异常编码细节
- try/else 分句
- 例子：默认行为
- 例子：捕捉内置异常
- try/finally 语句
- 统一 try/except/finally 语句
- 通过嵌套合并 finally 和 except
- 合并 try 的例子
- raise 语句
- Python 3.0 异常链：raise from
- assert 语句
- with/as 环境管理器
- 环境管理协议
- 本章小结
- 本章习题
- 习题解答
第34章异常对象
- 基于类的异常
- 类异常例子
- 为什么使用类异常
- 内置 Exception 类
- 默认打印和状态
- 定制打印显示
- 定制数据和行为
- 提供异常方法
- 本章小结
- 本章习题
- 习题解答
第35章异常的设计
- 例子：语法嵌套化
- 异常的习惯用法
- 函数信号条件和 raise
- 关闭文件和服务器连接
- 在 try 外进行调试
- 运行进程中的测试
- 关于 sys.exc_info
- 与异常有关的技巧
- 应该包装什么
- 捕捉过少：使用基于类的分类
- 核心语言总结
- 大型项目的开发工具
- 本章小结
- 第七部分练习题
第36章 Unicode 和字节字符串
- 字符串基础知识
- Python 的字符串类型
- 文本和二进制文件
- Python 3.0 中的字符串应用
- 转换
- 编码 Unicode 字符串
- 编码非ASCII文本
- 编码和解码非ASCII文本
- 其他 Unicode 编码技术
- 转换编码
- 在 Python 2.6 中编码 Unicode 字符串
- 源文件字符集编码声明
- 使用 Python 3.0 Bytes 对象
- 序列操作
- 创建 bytes 对象的其他方式
- 混合字符串类型
- 使用 Python 3.0（和 Python 2.6）bytearray 对象
- 使用文本文件和二进制文件
- Python 3.0 中的文本和二进制模式
- 类型和内容错误匹配
- 使用 Unicode 文件
- 在 Python 3.0 中处理 BOM
- Python 2.6 中的 Unicode 文件
- Python 3.0 中其他字符串工具的变化
- Struct二进制数据模块
- pickle对象序列化模块
- XML解析工具
- 本章小结
- 本章习题
- 习题解答
第37章管理属性
- 特性
- 第一个例子
- 计算的属性
- 使用装饰器编写特性
- 描述符
- 第一个示例
- 计算的属性
- 在描述符中使用状态信息
- 特性和描述符是如何相关的
- getattr 和 getattribute
- 第一个示例
- 计算属性
- getattr 和 getattribute 比较
- 拦截内置操作属性
- 重访基于委托的 Manager
- 示例：属性验证
- 使用描述符验证
- 使用 getattr 来验证
- 使用 getattribute 验证
- 本章小结
- 本章习题
- 习题解答
第38章装饰器
- 管理函数和类
- 使用和定义装饰器
- 为什么使用装饰器
- 基础知识
- 类装饰器
- 装饰器嵌套
- 装饰器参数
- 装饰器管理函数和类
- 编写函数装饰器
- 状态信息保持选项
- 类错误之一：装饰类方法
- 计时调用
- 添加装饰器参数
- 编写类装饰器
- 跟踪对象接口
- 类错误之二：保持多个实例
- 装饰器与管理器函数的关系
- 为什么使用装饰器（重访）
- 直接管理函数和类
- 示例：私有和公有属性
- 实现细节之一
- 使用dict 和 slots
- 公有声明的泛化
- 实现细节之二
- 开放问题
- Python不是关于控制
- 示例：验证函数参数
- 针对位置参数的一个基本范围测试装饰器
- 针对关键字和默认泛化
- 实现细节
- 开放问题
- 装饰器参数VS函数注解
- 其他应用程序：类型测试
- 本章小结
- 本章习题
- 习题解答
第39章元类
- 辅助函数的缺点
- 元类与类装饰器的关系：第一回合
- 元类模型
- 元类是 Type 的子类
- Class 语句协议
- 声明元类
- 编写元类
- 定制构建和初始化
- 其他元类编程技巧
- 实例与继承的关系
- 示例：向类添加方法
- 基于元类的扩展
- 元类与类装饰器的关系：第二回合
- 示例：对方法应用装饰器
- 用元类和装饰器跟踪
- 把任何装饰器应用于方法
- 元类与类装饰器的关系：第三回合
- 本章小结
- 本章习题
- 习题解答
附录A 安装和配置
- 从哪里获取 Python
- 安装步骤
- 配置 Python
- 如何设定配置选项
- Python 命令行选项
- 寻求更多帮助
附录B 各部分练习题的解答
- 第二部分类型和运算
- 第三部分语句和语法
- 第四部分函数
- 第五部分模块
- 第六部分类和 OOP
- 第七部分异常和工具
作者介绍
封面介绍

文江博客开发文档 Python 学习手册原书第4版文章详情

文章来源于网络收集而来，版权归原创者所有，如有侵权请及时联系！

在 Python 3.0 中处理 BOM

发布于 2024-01-29 22:24:14 字数 1915 浏览 0 评论 0 收藏 0

正如本章前面所介绍的，一些编码方式在文件的开始处存储了一个特殊的字节顺序标记（BOM）序列，来指定数据的大小尾方式或声明编码类型。如果编码名暗示了BOM的时候，Python在输入和将其写入输出的时候都会忽略该标记，但是有时候必须使用一个特定的编码名称来迫使显式地处理BOM。

例如，当我们把一个文本文件保存到Windows Notepad中的时候，可以在一个下拉列表中指定其编码类型——简单的ASCII文本、UTF-8或者小尾或大尾的UTF-16。例如，如果一个单行的、名为spam.txt的文本文件在Notepad中按照编码类型"ANSI"保存，它会编写为一个简单的ASCII文件而没有一个BOM。当这个文件在Python中以二进制模式读取的时候，我们可以看到存储在文件中的真正的bytes。当它作为文本读取的时候，Python默认会执行行尾转换，既然ASCII是UTF-8的一个子集（并且UTF-8是Python 3.0的默认编码），我们可以将其显式地解码为UTF-8文本：

如果文件在Notepad中保存为"UTF-8"，预先使用一个3字节UTF-8 BOM序列，并且我们需要给出更多具体编码名称（"utf-8-sig"）来迫使Python跳过标记：

如果文件作为“Unicode大尾”存储在Notepad中，我们得到了文件中的UTF-16格式的数据，预先使用一个两字节的BOM序列——在Python中，编码名"utf-16"忽略BOM，因为它是暗示的（因为所有的UTF-16文件都有一个BOM），并且"utf-16-be"处理大尾格式但不会忽略BOM：

对于输出通常也是这样。当用Python代码写入一个Unicode文件，我们需要一个更加显式的编码名称来强迫UTF-8中带有BOM——"utf-8"不会写入（或忽略）BOM，但"utf-8-sig"会这么做：

注意，尽管"utf-8"没有抛弃BOM，但不带BOM的数据可以用"utf-8"和"utf-8-sig"读取——如果你不确定一个文件中是否有BOM，使用后者进行输入（在机场安全检测线上，不要大声读出这一段）：

最后，对于编码名"utf-16"，BOM自动处理：在输出上，数据以平台本地的大小尾方式写入，并且，BOM总是会写的；在输入上，数据根据每个BOM解码，并且BOM总是会去除掉。更具体的UTF-16编码名称可以指定不同的大小尾，尽管在某些情况下如果需要或显示BOM的话，我们必须自己手动地编写和略过BOM：

更具体的UTF-16编码名称对于缺乏BOM的文件都工作得很好，尽管"utf-16"在输入时需要一个BOM以便确定字节顺序：

自己尝试实验这些编码，或者查看Python的库手册，以了解关于BOM的更多细节。

收藏 0

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

列表为空，暂无数据

我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的隐私政策了解更多相关信息。单击 接受 或继续使用网站，即表示您同意使用 Cookies 和您的相关数据。

原文