简单的 Web Scraper 不返回数据
我试图从网页中抓取数据,但它返回 [“F”] [“F”],如果没有检索到数据,它应该这样做。请参阅下面的代码 ` import pandas as pd import datetime i…
如何使用 beautifulsoup 和 selenium 抓取 glassdoor 薪资数据
我正在尝试从 glassdoor 网站上抓取薪资数据。但问题是,在这个过程中,由于某些原因,数据没有被收集。而且我不确定错误在哪里。 email = "" # your …
在 Scraping python 中打印重复的电子邮件和电话号码
我面临的问题是它打印两次电子邮件和电话号码,同时打印电话并发送到它如何修剪我尝试但失败的刮擦。 请帮助我摆脱这个困境。 import requests from b…
使用 Beautiful Soup 问题抓取数据
我正在努力从该网站抓取宇航员的国家/地区: https://www.supercluster.com/astronauts?ascending=false&limit=72&list=true&sort=launch%20order。我…
如何从网站提取的信息中获取 url
所以基本上我遇到了一个问题,我不知道如何从网站提取的数据中获取 URL。 这是我的代码: import requests from bs4 import BeautifulSoup req = requ…
通过更改 URL 中的页数来抓取下一页
我无法抓取下一页的信息。当某些标签发生变化时,我也会遇到问题,例如当网站开发人员在我到达 appart_response= requests.get(link) 时将“a href”…
Python请求无法获取网站的所有链接
我正在学习如何使用 Python urllib.requests 模块,并且我一直在尝试从网站获取所有链接,尽管它适用于大多数链接,但我在打开 这个。 我为此链接获得…
如何抓取和构建同一div但不同子类中的价格?
我正在尝试用两个不同的标签构建价格(见下图)。如何嵌套搜索,使其在 div class="price"、span 和子标签中查找? 如何从 div class="price" 中的 sp…
如何修复 BeautifulSoup IndexError 中的错误:列表索引超出范围
我正在尝试抓取该网站,但每次仍然发现此错误,尽管 span 标签中有文本,但代码显示错误: line 49, in beds.append(bed[i].text) IndexError: list i…
如何使用 python、beautifulsoup 将 Excel 工作表的名称拆分为 3 个单元格
我正在尝试刮掉名字并将它们导入到 Excel 工作表中以供以后使用。问题是我需要它们在 3 个不同的单元格中,first、last 和 initial。该脚本查找关键字…
使用 BeautifulSoup 抓取链接时出现问题
这是我的脚本: import requests from bs4 import BeautifulSoup import pandas as pd headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Wi…
如何抓取将鼠标悬停在元素上时出现的文本?
所以在电子商务网页上(https://www.jooraccess.com/r/products?token=feba69103f6c9789270a1412954cf250)当我将鼠标悬停在产品上时,会显示产品的颜…
如何从 div 类中仅抓取单个 href?
我想从这个 中提取第一个 的内容 Abstract | Full Text |
如何在 BeautifulSoup 中结合 find_all() 和 find_next() ?
所以我有一些我正在尝试解析的 HTML 片段。我想要获取的是价格(“84.00 USD”): Wholesale 84.00 USD soup.find(text="Wholesale").find_next().te…