- 内容提要
- 前言
- 作者简介
- 封面简介
- 第1章 理解高性能 Python
- 第2章 通过性能分析找到瓶颈
- 2.1 高效地分析性能
- 2.2 Julia 集合的介绍
- 2.3 计算完整的 Julia 集合
- 2.4 计时的简单方法——打印和修饰
- 2.5 用 UNIX 的 time 命令进行简单的计时
- 2.6 使用 cProfile 模块
- 2.7 用 runsnakerun 对 cProfile 的输出进行可视化
- 2.8 用 line_profiler 进行逐行分析
- 2.9 用 memory_profiler 诊断内存的用量
- 2.10 用 heapy 调查堆上的对象
- 2.11 用 dowser 实时画出变量的实例
- 2.12 用 dis 模块检查 CPython 字节码
- 2.13 在优化期间进行单元测试保持代码的正确性
- 2.14 确保性能分析成功的策略
- 2.15 小结
- 第3章 列表和元组
- 第4章 字典和集合
- 第5章 迭代器和生成器
- 第6章 矩阵和矢量计算
- 第7章 编译成 C
- 第8章 并发
- 第9章 multiprocessing 模块
- 第10章 集群和工作队列
- 第11章 使用更少的 RAM
- 第12章 现场教训
1.3 为什么使用 Python
Python具有高度的表现力且容易上手——新开发者会很快发现他们可以在很短时间里做到很多。许多Python库包含了用其他语言编写的工具,使Python可以轻易调用其他系统。比如,scikit-learn机器学习系统包含了LIBLINEAR和LIBSVM(两者皆以C语言写成),numpy库则包含了BLAS以及其他用C和Fortran语言写的库。因此,正确运用这些库的Python代码确实可以在速度上做到跟C媲美。
Python被誉为“内含电池”,因为它内建了很多重要且稳定的库。包括:
unicode和bytes
语言核心内建。
array
原始类型的高效数组。
math
基本数学操作,包括一些简单的统计数学。
sqlite3
包含了流行的基于文件的SQL引擎SQLite3。
collections
多种对象,包括双向队列、计数器和字典的变种。
除了这些语言核心库,还有大量的外部库,包括:
numpy
一个Python数字库(矩阵运算的基石库)。
scipy
大量可信的科学库的集合,通常包含了广受尊重的C和Fortran库。
pandas
一个数据分析库,类似于R语言的数据框或Excel表格,基于scipy和numpy。
scikit-learn
正在快速成为默认的机器学习库,基于scipy。
biopython
一个生物信息学库,类似于bioperl。
tornado
一个提供了并发机制的库。
各类数据库封装
为了跟基本上所有的数据库通信,包括Redis、MongoDB、HDF5以及SQL。
各类网站开发框架
用于创建网站的各种高性能系统,如django、pyramid、flask和tornado。
OpenCV
计算机视觉的封装。
各类API封装
用于轻松访问各种时髦的web API如Google、Twitter和LinkedIn。
为了适应各种部署环境,还有大量可选的管理环境和shell,包括:
标准发行版。
Enthought公司的EPD和Canopy,一个非常成熟且能干的环境。
Continuum公司的Anaconda,一个注重科学计算的环境。
Sage,一个类似于Matlab的环境,包括一个集成开发环境(IDE)。
Python(x,y)。
IPython,一个广泛被科学家和开发人员使用的Python互动shell。
IPython Notebook,一个基于浏览器的IPython前端,广泛用于教学和演示。
BPython,另一个Python互动shell。
Python的一大优势在于它可以快速实现出一个新主意的原型。由于存在各种支持库,它能够轻易测试出一个主意是否可行,哪怕第一个实现可能是磕磕碰碰做出来的。
如果你想要让你的数学函数更快,看看numpy。如果你想要实验一下机器学习,试试scikit-learn。如果你在清理和操作数据,那么pandas是一个好选择。
总的来说,我们有理由提出这样一个问题,“为了让我们的系统跑得更快而进行的优化从长期来看会不会反而导致我们团队整体跑得更慢了?”只要花费足够的人力,系统总是可以被榨出更多的性能,但这可能导致系统脆弱的可维护性以及难以理解的优化并最终导致整个团队绊倒在地。
Cython就是一个例子(7.6节),它将Python代码注释成类似C语言的类型,被转化后的代码可以被一个C编译器编译。它在速度上的提升令人惊叹(相对较少的努力就能获得C语言的速度),但后续代码的维护成本也会上升。尤其是,对这个新模块可能更难,因为团队成员需要具备一定的编程能力来理解那些为了性能提升而绕开Python虚拟机的折衷。
[1] 不要跟进程间通信(也是IPC)混淆——我们会在第9章讨论这个主题。
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论