Python刮擦动态表

发布于 2025-01-29 08:56:58 字数 274 浏览 2 评论 0 原文

我尝试了几次不同的尝试来刮擦以下页面：

某种程度上，我在请求或硒方法方面没有成功。

那些人有一个想法如何刮擦历史数据表的数据？

感谢您的提示。

Thinkerbell

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

冰魂雪魄 2025-02-05 08:56:58

您无法使用简单的请求绕过此网站。GET，Selenium/Splash，甚至旋转式Proxies都不会始终工作。这是因为，该网站使用“ Captcha Services”，并且知道您如何尝试访问页面。标题包含“ content-disposition：form-data; name ='recaptcha-token';”；有一个长的密码/编码术语，并且由于该术语是基于您的浏览活动，因此将其复制在标题中也无法正常工作。

对于这种棘手的网站，最佳选择是使用基于浏览器的附加组件，例如“ imacro ”。如果您开始浏览主页并加载更多的虚拟链接，则可以通过硒增加机会，然后再达到目标链接。