Python无法获取Web网页中的table标签数据

发布于 2022-09-13 00:15:34 字数 548 浏览 21 评论 0

用了下面的方法获取Web网页中table标签的数据, 但是结果始终返回None

第一种

from bs4 import BeautifulSoup

url = 'XXXXX'

headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:82.0) Gecko/20100101 Firefox/82.0'
    }

html = requests.get(url, headers=headers)
html = html.text
soup = BeautifulSoup(html, 'html', from_encoding='utf-8')  # html
content = soup.select(".kEvPDO")
print(content)

请问这是为什么,网页数据一般都是可以通过获取html标签内容或者通过网页接口或者API来得到,不明白为什么一直获取不到
image.png

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

划一舟意中人 2022-09-20 00:15:34

你没给出 具体的例子,你可以按照下面方式排查

  1. 确保 css选择器/xpath 没问题
  2. 确保 代码获取到的 html 有 table 内容,打印一下 html text。(很多数据在浏览器是懒加载,requests.get 没有 js 渲染,获取不到的)

例如:百度

xpath 取百度一下的 input

image.png

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文