如何从包含Python中嵌套标签解析的th标签中获取值?
如何在没有标签 a 值的情况下从 th 获取值 1926 [22] 我尝试过 table = soup.find('table', {"class": "standard"}) data_th = table.find('tbody').f…
抓取 requests.post 方法时出现错误
我正在尝试提取“德里”州办公室的数据。但是,我的代码无法正常工作。我确信我的 python 代码中的数据参数不正确。我已经导入了所有必需的库,例如 p…
如何绕过503 BS4 python
我怎样才能用BS4绕过503 Selenium工作了很长时间,所以我不想使用它 网站来请求 更改用户代理没有帮助, 代码中没有循环,此错误从第一个请求到达 hea…
Python无法从股票交易报告中获取表格
我的代码: import time import requests import pandas as pd from bs4 import BeautifulSoup URL = "https://www.hkex.com.hk/eng/stat/dmstat/dayr…
我如何调试它以将网页抓取的内容写入字段名称下的 CSV? (Python,美丽汤)
我希望在调试这个脚本时得到帮助。当我只是打印迭代循环时,我没有任何问题。我现在如何将该内容写入正确字段名称下的 csv 文件中?脚本位于 ''' from…
如何从 BS4 输出中生成列表
我现在有这段代码: from bs4 import BeautifulSoup import requests get = requests.get("https://solmfers-minting-site.netlify.app/") soup = Bea…
尝试使用 BeautifulSoup4 从网站上抓取文本,但什么也没发生
我想从这个网站抓取数据: https://playvalorant.com/en- us/news/game-updates/ from bs4 import BeautifulSoup import requests site_text = reques…
使用 BeautifulSoup 解析值
我想使用 python 从所有这些 html 中获取 src url。 我有这段代码来获取文本: avatar = html.find(class_ = "image-container image-container-playe…
使用 BeautifulSoup 从网页中抓取数据框中的 pdf 链接
我想提取所有 pdf 链接,这些链接将我们直接带到可以下载所有 pdf 的页面。我想将这些 pdf 存储在数据框中 url = "https://www.volvogroup.com/en/new…
网页抓取英格兰曲棍球 Python BeautifulSoup
我试图通过 BeautifulSoup 获取此链接中找到的表格: https://gms.englandhockey.co.uk/fixtures-and-results/competitions.php?comp=4154007 这是一…
简单的 Web Scraper 不返回数据
我试图从网页中抓取数据,但它返回 [“F”] [“F”],如果没有检索到数据,它应该这样做。请参阅下面的代码 ` import pandas as pd import datetime i…
如何使用 beautifulsoup 和 selenium 抓取 glassdoor 薪资数据
我正在尝试从 glassdoor 网站上抓取薪资数据。但问题是,在这个过程中,由于某些原因,数据没有被收集。而且我不确定错误在哪里。 email = "" # your …
在 Scraping python 中打印重复的电子邮件和电话号码
我面临的问题是它打印两次电子邮件和电话号码,同时打印电话并发送到它如何修剪我尝试但失败的刮擦。 请帮助我摆脱这个困境。 import requests from b…
使用 Beautiful Soup 问题抓取数据
我正在努力从该网站抓取宇航员的国家/地区: https://www.supercluster.com/astronauts?ascending=false&limit=72&list=true&sort=launch%20order。我…
如何从网站提取的信息中获取 url
所以基本上我遇到了一个问题,我不知道如何从网站提取的数据中获取 URL。 这是我的代码: import requests from bs4 import BeautifulSoup req = requ…