拆分问题:“NoneType”对象不可调用
我一直面临着分割/切片字符串的一个小问题: import requests from bs4 import BeautifulSoup url = 'http://www.example.com' r = requests.get(url)…
在Python中发送POST请求
我正在尝试抓取一个需要向表单发送 POST 请求以查询数据的网站。这是我正在使用的代码。 import requests headers = {'User-Agent': "Mozilla/5.0 (Wi…
使用 Python 进行网页抓取,从 sitemap.xml 中提取每个页面的微数据
我正在尝试从 sitemap.xml 中提取的页面中提取名称、品牌、价格、库存微数据 但我被以下步骤阻止了,谢谢您帮助我,因为我是新手,我无法理解阻止元素…
网页抓取问题 Beautifulsoup 网站上的所有链接
我想抓取以下网站的链接: https://www.electrive.com/category/ auto/ 我想要输出中列出的第 1 页上所有文章的链接。 太感谢了! from bs4 import Be…
通过 beautifulsoup 提取原始 HTML 内容(带有标签)
我正在使用 BeautifulSoup 和 Pandas 编写一个模块,希望从页面/文件中提取完整的原始 HTML 并将结果导出到电子表格。下面是一个示例: Content.html …
当页面编号加密时,如何通过 beautiful soup 导航到多个页面 Webscrap?
我曾经在网上抓取一个包含1000个页面的网站,我曾经遍历页面编号为1,2,3...1000的每个页面,并在Excel中下载数据,现在他们已经加密了页面编号。所以…
属性错误:“NoneType”对象没有属性“文本”;我美丽汤
所以我想创建一个可以通过从控制台输入 URL、类、元素和标头来工作的网络抓取工具。我想将 e 和 f 变量放入 d = list.find(g, class_=h).text.replace…
Python - 废弃 Woocommerce 不会带来价格文本
我正在工作中的网络和 Tango 数据库(我们的管理/管理系统)之间进行价格更新控制。 因此,我不得不取消我们网站上的 Python 价格。但 我在抓取 wooco…
Beautifullsoup 亚马逊产品详情
我无法使用 requests 或 requests_html 抓取“产品详细信息”部分(向下滚动网页,您会找到它)html。 Find_all 返回一个 0 大小的对象...有帮助吗? …
如何网络抓取元内容 - Python 网络抓取问题
我只想刮掉“汽车”一词,而不是带有元括号的整行。 所需的输出:“汽车” 你能告诉我如何解决这个问题吗?谢谢! from bs4 import BeautifulSoup imp…
从 JSON python 打印某些元素
我已经使用 python 运行了以下代码来创建一个 json 结构,并且我正在尝试打印“foods”结构中所有“title”元素的列表, import re import json from …
如何使用 bs4 和 selenium 仅抓取元素中文本的特定部分?
我正在尝试使用 BeatifulSoup4 抓取发送到电子邮件的验证码,并使用 selenium 将其粘贴到验证字段中。这是我用来提取元素内部文本的代码: soup = Bea…
使用 BeautifulSoup Python - Scraper OLX 单击按钮后获取值
我正在尝试从 olx 优惠中获取电话号码:例如 https://www.olx.pl/d/oferta/mieszkanie-do-wynajecia-40m2-ul-kosciuszki-96-CID3-IDNc5Bv.html#cc0c9f…