当前位置：文江博客话题详情

python | Web刮擦：HTML代码大多使用同一类时使用Web刮擦的问题，而没有任何ID或名称属性

发布于 2025-02-11 06:21:46 字数 471 浏览 1 评论 0原文

因此，我试图使用网络刮擦的页面是私人的。它使用双向身份验证，这不会让我通过硒打开链接。当我手动打开页面时，我不要求额外的身份验证。

该页面是自我使用页面上所有表的同一类，而TD标签中的类也大致相同。

这是带有数据的表，我不会提取

这是同一页面上的另一个表，我不需要，但是大多数都具有相同的类和标签

它确实杀死了我认为没有其他属性或任何内容可以使其更简单。由于事实并非如此，所以我真的很无知如何继续获取数据。

真正开放任何想法。提前提前

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

睫毛溺水了 2025-02-18 06:21:46

首先，如果数据始终处于相同的顺序中，则可以尝试使用CSS选择器，例如driver.find_element（by.css_selector，“ tr＆gt; td：nth-child（3）”）在第一个TR中获取第三个TD。

如果它不起作用，并且您的目标是获取与表中的密钥相关的信息，则可以制作一个循环以将表从表中收集到字典中，然后调用所需的键。

回复收藏 0 原文

~没有更多了~

关于作者

天赋异禀

暂无简介

文章

27 人气

关注发私信

闻呓

文章 0 评论 0

关注

深府石板幽径

文章 0 评论 0

关注

mabiao

文章 0 评论 0

关注

枕花眠

文章 0 评论 0

关注

qq_CrTt6n

文章 0 评论 0

关注

红颜悴

文章 0 评论 0

友情链接

文江博客

python | Web刮擦：HTML代码大多使用同一类时使用Web刮擦的问题，而没有任何ID或名称属性

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者