- 译者序
- 前言
- 第1章 问答环节
- 第2章 Python 如何运行程序
- 第3章 如何运行程序
- 第4章 介绍 Python 对象类型
- 第5章 数字
- 第6章 动态类型简介
- 第7章 字符串
- 第8章 列表与字典
- 第9章 元组、文件及其他
- 第10章 Python 语句简介
- 第11章 赋值、表达式和打印
- 第12章 if 测试和语法规则
- 第13章 while 和 for 循环
- 第14章 迭代器和解析,第一部分
- 第15章 文档
- 第16章 函数基础
- 第17章 作用域
- 第18章 参数
- 第19章 函数的高级话题
- 第20章 迭代和解析,第二部分
- 第21章 模块:宏伟蓝图
- 第22章 模块代码编写基础
- 第23章 模块包
- 第24章 高级模块话题
- 第25章 OOP:宏伟蓝图
- 第27章 更多实例
- 第28章 类代码编写细节
- 第29章 运算符重载
- 第30章 类的设计
- 第31章 类的高级主题
- 第32章 异常基础
- 第34章 异常对象
- 第35章 异常的设计
- 第36章 Unicode 和字节字符串
- 字符串基础知识
- Python 的字符串类型
- 文本和二进制文件
- Python 3.0 中的字符串应用
- 转换
- 编码 Unicode 字符串
- 编码非ASCII文本
- 编码和解码非ASCII文本
- 其他 Unicode 编码技术
- 转换编码
- 在 Python 2.6 中编码 Unicode 字符串
- 源文件字符集编码声明
- 使用 Python 3.0 Bytes 对象
- 序列操作
- 创建 bytes 对象的其他方式
- 混合字符串类型
- 使用 Python 3.0(和 Python 2.6)bytearray 对象
- 使用文本文件和二进制文件
- Python 3.0 中的文本和二进制模式
- 类型和内容错误匹配
- 使用 Unicode 文件
- 在 Python 3.0 中处理 BOM
- Python 2.6 中的 Unicode 文件
- Python 3.0 中其他字符串工具的变化
- Struct二进制数据模块
- pickle对象序列化模块
- XML解析工具
- 本章小结
- 本章习题
- 习题解答
- 第37章 管理属性
- 第38章 装饰器
- 第39章 元类
- 附录A 安装和配置
- 附录B 各部分练习题的解答
- 作者介绍
- 封面介绍
文章来源于网络收集而来,版权归原创者所有,如有侵权请及时联系!
Python 3.0 中其他字符串工具的变化
Python标准库中其他一些常用的字符串处理工具,也由于新的str/bytes类型区分而进行了修改。我们无法在这本介绍核心语言的图书里覆盖所有这些面向应用的工具的细节,但是,为了结束本章的讨论,这里快速看一下受到影响的4种主要的工具:re模式匹配模块、struct二进制数据模块、pickle对象序列化模块和用于解析XML文本的xml包。
re模式匹配模块
Python的r e模式匹配模块提供的文本处理,比简单的方法调用所提供的查找、分隔、替换等更加通用。借助re,设定搜索和分隔目标的字符串可以用更通用的模式来描述,而不是用绝对文本描述。这个模块已经泛化为可以用于Python 3.0中的任何字符串类型的对象——str、bytes和bytearray,并且返回同样类型的结果子字符串作为目标字符串。
如下是其在Python 3.0中的引用,从一行文本提取子字符串。在模式字符串中,(.*)表示任何字符(.)、0或多次(*)、,作为一个匹配的子字符串单独保存(())。在成功匹配之后,根据包含在圆括号中的模式部分而匹配的字符串部分就可以使用,通过group或groups方法:
Python 2.6中的结果是类似的,但是,unicode类型用于非ASCII文本,并且str处理8位的和二进制文本:
由于bytes和str支持基本相同的操作集,所以这种类型差异大部分很明显。但是,注意,像在其他的API中一样,我们不能在Python 3.0调用的参数中混合str和bytes类型(尽管如果你不想在二进制数据上进行模式匹配,可能不需要关心这一点):
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论