如何使用 Python 解析无限滚动页面(例如 Wallbase.cc/search/sky)?

发布于 2024-12-16 18:36:56 字数 55 浏览 1 评论 0原文

不确定 Mechanize 或 BeautifulSoup 是否有任何帮助。任何建议将不胜感激!

Not sure if there's anything with Mechanize or BeautifulSoup that could help. Any suggestions would be greatly appreciated!

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

那小子欠揍 2024-12-23 18:36:56

Mechanize 和 Beautiful soup 无法与用于无限滚动的 javascript 交互。

硒可以。

此外,如果您在使用无限滚动时查看 ajax 请求,您将看到一个对 http://wallbase.cc/search/160 的发布请求,其中包含请求数据:

query:sky
board:123
res_opt:eqeq
res:0x0
aspect:0
nsfw_sfw:1
nsfw_sketchy:0
nsfw_nsfw:0
thpp:32
orderby:relevance
orderby_opt:desc

160 对应于图像范围,因此之前的请求是 wallbase.cc/searchar/128

Mechanize and Beautiful soup can't inteface with the javascript used for the infinite scroll.

Selenium can.

Additionally if you were to view the ajax requests when you use the infinite scroll you would see a post request to http://wallbase.cc/search/160 with the request data:

query:sky
board:123
res_opt:eqeq
res:0x0
aspect:0
nsfw_sfw:1
nsfw_sketchy:0
nsfw_nsfw:0
thpp:32
orderby:relevance
orderby_opt:desc

160 corresponds to the image range so the request before it was wallbase.cc/searc/128.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文