beautifulsoup

beautifulsoup

文章 107 浏览 125

拆分问题:“NoneType”对象不可调用

我一直面临着分割/切片字符串的一个小问题: import requests from bs4 import BeautifulSoup url = 'http://www.example.com' r = requests.get(url)…

心碎无痕… 2025-01-09 18:37:37 0 0

在Python中发送POST请求

我正在尝试抓取一个需要向表单发送 POST 请求以查询数据的网站。这是我正在使用的代码。 import requests headers = {'User-Agent': "Mozilla/5.0 (Wi…

白况 2025-01-09 18:23:05 0 0

使用 Python 进行网页抓取,从 sitemap.xml 中提取每个页面的微数据

我正在尝试从 sitemap.xml 中提取的页面中提取名称、品牌、价格、库存微数据 但我被以下步骤阻止了,谢谢您帮助我,因为我是新手,我无法理解阻止元素…

会傲 2025-01-09 17:43:56 0 0

网页抓取问题 Beautifulsoup 网站上的所有链接

我想抓取以下网站的链接: https://www.electrive.com/category/ auto/ 我想要输出中列出的第 1 页上所有文章的链接。 太感谢了! from bs4 import Be…

惯饮孤独 2025-01-09 17:40:54 0 0

通过 beautifulsoup 提取原始 HTML 内容(带有标签)

我正在使用 BeautifulSoup 和 Pandas 编写一个模块,希望从页面/文件中提取完整的原始 HTML 并将结果导出到电子表格。下面是一个示例: Content.html …

我不是你的备胎 2025-01-09 17:33:08 1 0

当页面编号加密时,如何通过 beautiful soup 导航到多个页面 Webscrap?

我曾经在网上抓取一个包含1000个页面的网站,我曾经遍历页面编号为1,2,3...1000的每个页面,并在Excel中下载数据,现在他们已经加密了页面编号。所以…

入画浅相思 2025-01-09 15:15:26 0 0

属性错误:“NoneType”对象没有属性“文本”;我美丽汤

所以我想创建一个可以通过从控制台输入 URL、类、元素和标头来工作的网络抓取工具。我想将 e 和 f 变量放入 d = list.find(g, class_=h).text.replace…

旧情别恋 2025-01-09 14:45:34 0 0

Python - 废弃 Woocommerce 不会带来价格文本

我正在工作中的网络和 Tango 数据库(我们的管理/管理系统)之间进行价格更新控制。 因此,我不得不取消我们网站上的 Python 价格。但 我在抓取 wooco…

微凉徒眸意 2025-01-09 13:11:06 0 0

从谷歌搜索结果中提取印度公司的数据

我正在抓取印度公司的数据,我从ambitionbox.com抓取了一半的数据 另一半我试图从谷歌搜索结果中删除,但我被困在这里 我在提取这一部分时遇到问题搜…

菊凝晚露 2025-01-09 10:31:03 0 0

Beautifullsoup 亚马逊产品详情

我无法使用 requests 或 requests_html 抓取“产品详细信息”部分(向下滚动网页,您会找到它)html。 Find_all 返回一个 0 大小的对象...有帮助吗? …

喜爱纠缠 2025-01-09 09:49:40 0 0

如何网络抓取元内容 - Python 网络抓取问题

我只想刮掉“汽车”一词,而不是带有元括号的整行。 所需的输出:“汽车” 你能告诉我如何解决这个问题吗?谢谢! from bs4 import BeautifulSoup imp…

挽你眉间 2025-01-09 09:34:06 0 0

从 JSON python 打印某些元素

我已经使用 python 运行了以下代码来创建一个 json 结构,并且我正在尝试打印“foods”结构中所有“title”元素的列表, import re import json from …

绮筵 2025-01-09 09:31:35 0 0

如何使用 bs4 和 selenium 仅抓取元素中文本的特定部分?

我正在尝试使用 BeatifulSoup4 抓取发送到电子邮件的验证码,并使用 selenium 将其粘贴到验证字段中。这是我用来提取元素内部文本的代码: soup = Bea…

痴梦一场 2025-01-09 09:11:35 0 0

需要在列表追加中包含缺失值

我正在寻找创建 URL 和 Marketo 表单 ID 的数据框(如果它们位于页面上)。我遇到的问题是,当我遇到没有表单的页面时,缺失的值不会附加到空白列表中…

つ低調成傷 2025-01-09 08:56:28 0 0

使用 BeautifulSoup Python - Scraper OLX 单击按钮后获取值

我正在尝试从 olx 优惠中获取电话号码:例如 https://www.olx.pl/d/oferta/mieszkanie-do-wynajecia-40m2-ul-kosciuszki-96-CID3-IDNc5Bv.html#cc0c9f…

东走西顾 2025-01-09 07:40:27 1 0
更多

推荐作者

紫罗兰の梦幻

文章 0 评论 0

-2134

文章 0 评论 0

liuxuanli

文章 0 评论 0

意中人

文章 0 评论 0

○愚か者の日

文章 0 评论 0

xxhui

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文