返回介绍

迭代器对象:__iter__ 和 __next__

发布于 2024-01-29 22:24:15 字数 2102 浏览 0 评论 0 收藏 0

尽管上一节中的__getitem__技术有效,但它真的只是迭代的一种退而求其次的方法。如今,Python中所有的迭代环境都会先尝试__iter__方法,再尝试__getitem__。也就是说,它们宁愿使用第14章所学到的迭代协议,然后才是重复对对象进行索引运算。只有在对象不支持迭代协议的时候,才会尝试索引运算。一般来讲,你也应该优先使用__iter__,它能够比__getitem__更好地支持一般的迭代环境。

从技术角度来讲,迭代环境是通过调用内置函数iter去尝试寻找__iter__方法来实现的,而这种方法应该返回一个迭代器对象。如果已经提供了,Python就会重复调用这个迭代器对象的next方法,直到发生StopIteration异常。如果没找到这类__iter__方法,Python会改用__getitem__机制,就像之前那样通过偏移量重复索引,直到引发Index Error异常(对于手动迭代来说,一个next内置函数也可以很方便地使用:next(I)与I.__next__()是相同的)。

注意:版本差异提示:正如第14章所述,如果你使用Python 2.6,刚刚所提到的I.__next__()在你的Python中叫做I.next(),而next(I)内置函数展现出了可移植性:它在Python 2.6中叫做I.next(),而在Python 3.0中叫做I.__next__()。迭代的所有其他方面在Python 2.6中都同样起作用。

用户定义的迭代器

在__iter__机制中,类就是通过实现第14章和第20章介绍的迭代器协议(回头去看那几章以了解迭代器的背景细节),来实现用户定义的迭代器的。例如,下面的文件iters.py,定义了用户定义的迭代器类来生成平方值。

在这里,迭代器对象就是实例self,因为next方法是这个类的一部分。在较为复杂的场景中,迭代器对象可定义为个别的类或有自己的状态信息的对象,对相同数据支持多种迭代(下面会看到这种例子)。以Python raise语句发出信号表示迭代结束(本书下一部分会谈到引发异常的内容)。手动迭代对内置类型也有效:

__getitem__所写的等效代码可能不是很自然,因为for会对所有的0和较高值的偏移值进行迭代。传入的偏移值和所产生的值的范围只有间接的关系(0..N需要映射为start..stop)。因为__iter__对象会在调用过程中明确地保留状态信息,所以比__getitem__具有更好的通用性。

另外,有时__iter__迭代器会比__getitem__更复杂和难用。迭代器是用来迭代,不是随机的索引运算。事实上,迭代器根本没有重载索引表达式:

__iter__机制也是我们在__getitem__中所见到的其他所有迭代环境的实现方式(成员关系测试、类型构造函数、序列赋值运算等)。然而,和__getitem__不同的是,__iter__只循环一次,而不是循环多次。例如,Squares类只循环一次,循环之后就变为空。每次新的循环,都得创建一个新的迭代器对象。

注意:如果用生成器函数编写(第20章介绍过迭代器相关的主题),这个例子可能更简单一些。

和类不同的是,这个函数会自动在迭代中存储其状态。当然,这是假设的例子。实际上,可以跳过这两种技术,只用for循环、map或是列表解析,一次创建这个列表。在Python中,完成任务最佳而且是最快的方式通常也是最简单的方式:

然而,在模拟更复杂的迭代时,类会比较好用,特别是能够获益于状态信息和继承层次。下一节要探索这种情况下的使用例子。

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。
列表为空,暂无数据
    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文