如何使用 Python 解析无限滚动页面(例如 Wallbase.cc/search/sky)?
不确定 Mechanize 或 BeautifulSoup 是否有任何帮助。任何建议将不胜感激!
Not sure if there's anything with Mechanize or BeautifulSoup that could help. Any suggestions would be greatly appreciated!
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
Mechanize 和 Beautiful soup 无法与用于无限滚动的 javascript 交互。
硒可以。
此外,如果您在使用无限滚动时查看 ajax 请求,您将看到一个对
http://wallbase.cc/search/160
的发布请求,其中包含请求数据:160 对应于图像范围,因此之前的请求是
wallbase.cc/searchar/128
。Mechanize and Beautiful soup can't inteface with the javascript used for the infinite scroll.
Selenium can.
Additionally if you were to view the ajax requests when you use the infinite scroll you would see a post request to
http://wallbase.cc/search/160
with the request data:160 corresponds to the image range so the request before it was
wallbase.cc/searc/128
.