当前位置：文江博客话题详情

Python Selenium dynamic Splinter lazy-loading

在Python Splinter/Selenium中，如何将所有内容加载到懒惰的网页中

发布于 2025-02-09 18:25:31 字数 378 浏览 5 评论 0原文

我想做的 - 现在，我想在网站中抓取内容（类似于公司的股价）。每个元素（IE股票价格）的值每1秒更新一次。但是，该网络是一个懒惰的页面，因此一次只能看到5个元素，同时，我需要从200个元素中收集所有数据。

我尝试的 - 我使用python splinter在元素的Div.Class中获取数据，但是，围绕当前视图的5-10个元素出现在HTML代码中。我尝试向下滚动浏览器，然后我可以获取下一个元素（下一个公司的股票价格），但是先前元素的信息不再可用。这个过程（向下滚动并获取新数据）太慢了，当我可以完成所有200个元素时，第一个元素的值几次更改。

那么，您能建议一些解决这个问题的方法吗？有什么方法可以迫使浏览器加载所有内容而不是懒惰加载？

收藏 0

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

评论（1）

复古式 2025-02-16 18:25:31

没有正确的方法。这取决于网站如何在后台工作。通常，如果它是一个懒惰的页面，则有两个选项。

硒。它执行所有JS脚本，并“合并”从背景到完整页面的所有请求，例如普通的WebBrowser。
访问API。在这种情况下，您不必关心UI和动态隐藏的元素。 API使您可以访问网页上的所有数据，通常比显示的更多数据。

在您的情况下，如果每秒有更新，听起来像个
流连接（也许是WebStream）。因此，尝试弄清楚如何
网站获取数据，然后尝试直接刮擦API端点。
它是什么页面？

回复收藏 0 原文

~没有更多了~

关于作者

盛夏已如深秋|

暂无简介

文章

评论

27 人气

关注发私信

相关话题

热门标签

操作系统程序设计 IT运维 Linux系统管理 JavaScript 服务器应用 solaris C/C++ PHP Shell BSD Vue.js aix Oracle Python HTML 系统管理 HTML5 CSS 前端

推荐作者

櫻之舞

文章 0 评论 0

弥枳

文章 0 评论 0

m2429

文章 0 评论 0

寻找一个思念的角度

文章 0 评论 0

野却迷人

文章 0 评论 0

我怀念的。

文章 0 评论 0

友情链接

我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的隐私政策了解更多相关信息。单击 接受 或继续使用网站，即表示您同意使用 Cookies 和您的相关数据。

原文