- 前言
- 目标读者
- 非目标读者
- 本书的结构
- 以实践为基础
- 硬件
- 杂谈:个人的一点看法
- Python 术语表
- Python 版本表
- 排版约定
- 使用代码示例
- 第一部分 序幕
- 第 1 章 Python 数据模型
- 第二部分 数据结构
- 第 2 章 序列构成的数组
- 第 3 章 字典和集合
- 第 4 章 文本和字节序列
- 第三部分 把函数视作对象
- 第 5 章 一等函数
- 第 6 章 使用一等函数实现设计模式
- 第 7 章 函数装饰器和闭包
- 第四部分 面向对象惯用法
- 第 8 章 对象引用、可变性和垃圾回收
- 第 9 章 符合 Python 风格的对象
- 第 10 章 序列的修改、散列和切片
- 第 11 章 接口:从协议到抽象基类
- 第 12 章 继承的优缺点
- 第 13 章 正确重载运算符
- 第五部分 控制流程
- 第 14 章 可迭代的对象、迭代器和生成器
- 14.1 Sentence 类第1版:单词序列
- 14.2 可迭代的对象与迭代器的对比
- 14.3 Sentence 类第2版:典型的迭代器
- 14.4 Sentence 类第3版:生成器函数
- 14.5 Sentence 类第4版:惰性实现
- 14.6 Sentence 类第5版:生成器表达式
- 14.7 何时使用生成器表达式
- 14.8 另一个示例:等差数列生成器
- 14.9 标准库中的生成器函数
- 14.10 Python 3.3 中新出现的句法:yield from
- 14.11 可迭代的归约函数
- 14.12 深入分析 iter 函数
- 14.13 案例分析:在数据库转换工具中使用生成器
- 14.14 把生成器当成协程
- 14.15 本章小结
- 14.16 延伸阅读
- 第 15 章 上下文管理器和 else 块
- 第 16 章 协程
- 第 17 章 使用期物处理并发
- 第 18 章 使用 asyncio 包处理并发
- 第六部分 元编程
- 第 19 章 动态属性和特性
- 第 20 章 属性描述符
- 第 21 章 类元编程
- 结语
- 延伸阅读
- 附录 A 辅助脚本
- Python 术语表
- 作者简介
- 关于封面
2.6 序列的增量赋值
增量赋值运算符 += 和 *= 的表现取决于它们的第一个操作对象。简单起见,我们把讨论集中在增量加法(+=)上,但是这些概念对 *= 和其他增量运算符来说都是一样的。
+= 背后的特殊方法是 __iadd__ (用于“就地加法”)。但是如果一个类没有实现这个方法的话,Python 会退一步调用 __add__ 。考虑下面这个简单的表达式:
>>> a += b
如果 a 实现了 __iadd__ 方法,就会调用这个方法。同时对可变序列(例如 list、bytearray 和 array.array)来说,a 会就地改动,就像调用了 a.extend(b) 一样。但是如果 a 没有实现 __iadd__ 的话,a += b 这个表达式的效果就变得跟 a = a + b 一样了:首先计算 a + b,得到一个新的对象,然后赋值给 a。也就是说,在这个表达式中,变量名会不会被关联到新的对象,完全取决于这个类型有没有实现 __iadd__ 这个方法。
总体来讲,可变序列一般都实现了 __iadd__ 方法,因此 += 是就地加法。而不可变序列根本就不支持这个操作,对这个方法的实现也就无从谈起。
上面所说的这些关于 += 的概念也适用于 *=,不同的是,后者相对应的是 __imul__。关于 __iadd__ 和 __imul__,第 13 章中会再次提到。
接下来有个小例子,展示的是 *= 在可变和不可变序列上的作用:
>>> l = [1, 2, 3] >>> id(l) 4311953800 ➊ >>> l *= 2 >>> l [1, 2, 3, 1, 2, 3] >>> id(l) 4311953800 ➋ >>> t = (1, 2, 3) >>> id(t) 4312681568 ➌ >>> t *= 2 >>> id(t) 4301348296 ➍
❶ 刚开始时列表的 ID。
❷ 运用增量乘法后,列表的 ID 没变,新元素追加到列表上。
❸ 元组最开始的 ID。
❹ 运用增量乘法后,新的元组被创建。
对不可变序列进行重复拼接操作的话,效率会很低,因为每次都有一个新对象,而解释器需要把原来对象中的元素先复制到新的对象里,然后再追加新的元素。4
4str 是一个例外,因为对字符串做 += 实在是太普遍了,所以 CPython 对它做了优化。为 str 初始化内存的时候,程序会为它留出额外的可扩展空间,因此进行增量操作的时候,并不会涉及复制原有字符串到新位置这类操作。
我们已经认识了 += 的一般用法,下面来看一个有意思的边界情况。这个例子可以说是突出展示了“不可变性”对于元组来说到底意味着什么。
一个关于+=的谜题
读完下面的代码,然后回答这个问题:示例 2-14 中的两个表达式到底会产生什么结果? 5回答之前不要用控制台去运行这两个式子。
5感谢 Leonardo Rochael 在 2013 年的 Python 巴西会议上提到这个谜题。
示例 2-14 一个谜题
>>> t = (1, 2, [30, 40]) >>> t[2] += [50, 60]
到底会发生下面 4 种情况中的哪一种?
a. t 变成 (1, 2, [30, 40, 50, 60])。
b. 因为 tuple 不支持对它的元素赋值,所以会抛出 TypeError 异常。
c. 以上两个都不是。
d. a 和 b 都是对的。
我刚看到这个问题的时候,异常确定地选择了 b,但其实答案是 d,也就是说 a 和 b 都是对的!示例 2-15 是运行这段代码得到的结果,用的 Python 版本是 3.4,但是在 2.7 中结果也一样。6
6有读者提出,如果写成 t[2].extend([50, 60]) 就能避免这个异常。确实是这样,但这个例子是为了展示这种奇怪的现象而专门写的。
示例 2-15 没人料到的结果:t[2] 被改动了,但是也有异常抛出
>>> t = (1, 2, [30, 40]) >>> t[2] += [50, 60] Traceback (most recent call last): File "<stdin>", line 1, in <module> TypeError: 'tuple' object does not support item assignment >>> t (1, 2, [30, 40, 50, 60])
Python Tutor是一个对 Python 运行原理进行可视化分析的工具。图 2-3 里是两张截图,分别代表示例 2-15 中 t 的初始和最终状态。
图 2-3:元组赋值之谜的初始和最终状态(图表由 Python Tutor 网站生成)
下面来看看示例 2-16 中 Python 为表达式 s[a] += b 生成的字节码,可能这个现象背后的原因会变得清晰起来。
示例 2-16 s[a] += b 背后的字节码
>>> dis.dis('s[a] += b') 1 0 LOAD_NAME 0(s) 3 LOAD_NAME 1(a) 6 DUP_TOP_TWO 7 BINARY_SUBSCR ➊ 8 LOAD_NAME 2(b) 11 INPLACE_ADD ➋ 12 ROT_THREE 13 STORE_SUBSCR ➌ 14 LOAD_CONST 0(None) 17 RETURN_VALUE
➊ 将 s[a] 的值存入 TOS(Top Of Stack,栈的顶端)。
➋ 计算 TOS += b。这一步能够完成,是因为 TOS 指向的是一个可变对象(也就是示例 2-15 里的列表)。
➌ s[a] = TOS 赋值。这一步失败,是因为 s 是不可变的元组(示例 2-15 中的元组 t)。
这其实是个非常罕见的边界情况,在 15 年的 Python 生涯中,我还没见过谁在这个地方吃过亏。
至此我得到了 3 个教训。
不要把可变对象放在元组里面。
增量赋值不是一个原子操作。我们刚才也看到了,它虽然抛出了异常,但还是完成了操作。
查看 Python 的字节码并不难,而且它对我们了解代码背后的运行机制很有帮助。
在见证了 + 和 * 的微妙之处后,我们把话题转移到序列类型的另一个重要部分上:排序。
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论