- 前言
- 目标读者
- 非目标读者
- 本书的结构
- 以实践为基础
- 硬件
- 杂谈:个人的一点看法
- Python 术语表
- Python 版本表
- 排版约定
- 使用代码示例
- 第一部分 序幕
- 第 1 章 Python 数据模型
- 第二部分 数据结构
- 第 2 章 序列构成的数组
- 第 3 章 字典和集合
- 第 4 章 文本和字节序列
- 第三部分 把函数视作对象
- 第 5 章 一等函数
- 第 6 章 使用一等函数实现设计模式
- 第 7 章 函数装饰器和闭包
- 第四部分 面向对象惯用法
- 第 8 章 对象引用、可变性和垃圾回收
- 第 9 章 符合 Python 风格的对象
- 第 10 章 序列的修改、散列和切片
- 第 11 章 接口:从协议到抽象基类
- 第 12 章 继承的优缺点
- 第 13 章 正确重载运算符
- 第五部分 控制流程
- 第 14 章 可迭代的对象、迭代器和生成器
- 14.1 Sentence 类第1版:单词序列
- 14.2 可迭代的对象与迭代器的对比
- 14.3 Sentence 类第2版:典型的迭代器
- 14.4 Sentence 类第3版:生成器函数
- 14.5 Sentence 类第4版:惰性实现
- 14.6 Sentence 类第5版:生成器表达式
- 14.7 何时使用生成器表达式
- 14.8 另一个示例:等差数列生成器
- 14.9 标准库中的生成器函数
- 14.10 Python 3.3 中新出现的句法:yield from
- 14.11 可迭代的归约函数
- 14.12 深入分析 iter 函数
- 14.13 案例分析:在数据库转换工具中使用生成器
- 14.14 把生成器当成协程
- 14.15 本章小结
- 14.16 延伸阅读
- 第 15 章 上下文管理器和 else 块
- 第 16 章 协程
- 第 17 章 使用期物处理并发
- 第 18 章 使用 asyncio 包处理并发
- 第六部分 元编程
- 第 19 章 动态属性和特性
- 第 20 章 属性描述符
- 第 21 章 类元编程
- 结语
- 延伸阅读
- 附录 A 辅助脚本
- Python 术语表
- 作者简介
- 关于封面
文章来源于网络收集而来,版权归原创者所有,如有侵权请及时联系!
A.1 第3章:in 运算符的性能测试
表 3-6 中的计时数据是我使用示例 A-1 中的代码生成的,这段代码用到了 timeit 模块。这个脚本主要用于设置 haystack 和 needles 样本,并格式化输出。
编写示例 A-1 时,我发现的确能客观比较 dict 的性能。如果在“详细模式”(指定命令行选项 -v)中运行这个脚本,用时几乎是表 3-5 中的两倍。但是注意,对这个脚本来说,在“详细模式”中,只是多了用于设置测试内容的四个 print 调用,以及在各个测试结束后显示找到多少个 needles 的那个 print 调用。在 haystack 中搜索 needles 的那个循环没有输出,不过这五个 print 调用耗费的时间与搜索 1000 个 needles 差不多。
示例 A-1 container_perftest.py:运行时以内置集合类型的名称为命令行参数(例如 container_perftest.py dict)
""" 对容器的``in``运算符做性能测试 """ import sys import timeit SETUP = ''' import array selected = array.array('d') with open('selected.arr', 'rb') as fp: selected.fromfile(fp, {size}) if {container_type} is dict: haystack = dict.fromkeys(selected, 1) else: haystack = {container_type}(selected) if {verbose}: print(type(haystack), end=' ') print('haystack: %10d' % len(haystack), end=' ') needles = array.array('d') with open('not_selected.arr', 'rb') as fp: needles.fromfile(fp, 500) needles.extend(selected[::{size}//500]) if {verbose}: print(' needles: %10d' % len(needles), end=' ') ''' TEST = ''' found = 0 for n in needles: if n in haystack: found += 1 if {verbose}: print(' found: %10d' % found) ''' def test(container_type, verbose): MAX_EXPONENT = 7 for n in range(3, MAX_EXPONENT + 1): size = 10**n setup = SETUP.format(container_type=container_type, size=size, verbose=verbose) test = TEST.format(verbose=verbose) tt = timeit.repeat(stmt=test, setup=setup, repeat=5, number=1) print('|{:{}d}|{:f}'.format(size, MAX_EXPONENT + 1, min(tt))) if __name__=='__main__': if '-v' in sys.argv: sys.argv.remove('-v') verbose = True else: verbose = False if len(sys.argv) != 2: print('Usage: %s <container_type>' % sys.argv[0]) else: test(sys.argv[1], verbose)
container_perftest_datagen.py 脚本(见示例 A-2)为示例 A-1 中的脚本生成固件数据。
示例 A-2 container_perftest_datagen.py:生成由不同的浮点数组成的数组,然后写入文件,供示例 A-1 使用
""" 生成容器性能测试所需的数据 """ import random import array MAX_EXPONENT = 7 HAYSTACK_LEN = 10 ** MAX_EXPONENT NEEDLES_LEN = 10 ** (MAX_EXPONENT - 1) SAMPLE_LEN = HAYSTACK_LEN + NEEDLES_LEN // 2 needles = array.array('d') sample = {1/random.random() for i in range(SAMPLE_LEN)} print('initial sample: %d elements' % len(sample)) # 完整的样本,防止丢弃了重复的随机数 while len(sample) < SAMPLE_LEN: sample.add(1/random.random()) print('complete sample: %d elements' % len(sample)) sample = array.array('d', sample) random.shuffle(sample) not_selected = sample[:NEEDLES_LEN // 2] print('not selected: %d samples' % len(not_selected)) print(' writing not_selected.arr') with open('not_selected.arr', 'wb') as fp: not_selected.tofile(fp) selected = sample[NEEDLES_LEN // 2:] print('selected: %d samples' % len(selected)) print(' writing selected.arr') with open('selected.arr', 'wb') as fp: selected.tofile(fp)
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论