- 内容提要
- 前言
- 作者简介
- 封面简介
- 第1章 理解高性能 Python
- 第2章 通过性能分析找到瓶颈
- 2.1 高效地分析性能
- 2.2 Julia 集合的介绍
- 2.3 计算完整的 Julia 集合
- 2.4 计时的简单方法——打印和修饰
- 2.5 用 UNIX 的 time 命令进行简单的计时
- 2.6 使用 cProfile 模块
- 2.7 用 runsnakerun 对 cProfile 的输出进行可视化
- 2.8 用 line_profiler 进行逐行分析
- 2.9 用 memory_profiler 诊断内存的用量
- 2.10 用 heapy 调查堆上的对象
- 2.11 用 dowser 实时画出变量的实例
- 2.12 用 dis 模块检查 CPython 字节码
- 2.13 在优化期间进行单元测试保持代码的正确性
- 2.14 确保性能分析成功的策略
- 2.15 小结
- 第3章 列表和元组
- 第4章 字典和集合
- 第5章 迭代器和生成器
- 第6章 矩阵和矢量计算
- 第7章 编译成 C
- 第8章 并发
- 第9章 multiprocessing 模块
- 第10章 集群和工作队列
- 第11章 使用更少的 RAM
- 第12章 现场教训
文章来源于网络收集而来,版权归原创者所有,如有侵权请及时联系!
4.3 小结
字典和集合适用于存储能够被键索引的数据。散列函数对键的使用方式极大地影响数据结构的最终性能。另外,理解字典如何工作不仅可以让你更好地组织你的数据,同时也能让你更好地组织你的代码,因为字典是Python的内部功能之一。
我们将在下一章探索生成器,它令我们能够对数据进行更强的控制,而且不需要预先在内存中保存完整的数据集。这让我们得以绕过很多使用Python内部数据结构时可能遇到的障碍。
[1] 我们将在4.1.4节中讨论,字典和集合十分依赖它们的散列函数。如果它们的散列函数对某个数据类型不具有O(1)的计算时间,那么包含该数据类型的字典和集合都不具有O(1)保证。
[2] 掩码是一个二进制数,用来截断另一个数字。比如,0b1111101 & 0b111 = 0b101 = 5意味着掩码0b111截断了数字0b1111101。这一操作也可以被看作是获取一个数字的最低几位。
[3] 5这个值来自线性同余生成器(LCG)的一个属性,它被用来生成随机数。
[4] 更多信息见http://wiki.python.org/moin/DictionaryKeys。
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论