文章来源于网络收集而来,版权归原创者所有,如有侵权请及时联系!
第10章 理解 Scrapy 性能
通常情况下,性能很容易出现问题。对于Scrapy来说,性能就不只是容易出现问题了,而是几乎肯定会出现,因为它有很多有悖常理的行为。除非你对Scrapy内部有非常好的理解,否则你会发现,即使非常努力地优化性能,也很可能得不到收益。这是使用高性能、低延迟以及高并发环境复杂性的一部分。在优化瓶颈性能时,阿姆达尔定律仍然是正确的,不过除非你能指明真正的瓶颈所在,否则在系统其他任何部分的优化都无法增长每秒能够抓取的item数量(吞吐量)。我们可以从Goldratt博士经典的The Goal一书中获得更多的感知,这本商务书籍通过优秀的隐喻对瓶颈、延迟和吞吐量的理念进行了阐释。相同的理念同样也适用于软件。本章将帮助你找出Scrapy配置中的瓶颈,以及避免出现明显的错误。
请注意本章是一个进阶章节,其中会涉及一些数学知识。计算将会比较简单,并且会附有用于展示相同概念的图表。如果你不喜欢数学,只需忽略掉公式即可,你仍然能够获得Scrapy性能如何工作的重要领悟。
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论