web-scraping

web-scraping

文章 0 浏览 7

如果页面有不同的变化,如何在页面中找到文本?

我有一个元素,例如< span class =“ ads_price” id =“ tdo_8”> 7 650€</span> ,我需要按价格找到此元素,但是问题是我不知道价…

美人迟暮 2025-02-03 13:38:14 2 0

为什么我会因Selenium XPath遇到错误

我正在尝试访问我在网站上可以找到的文本的所有实例。 rows = waitForAllElementsToLoad(By.XPATH, "//td[contains(.,'Jones']") def waitForAllEleme…

满栀 2025-02-03 13:12:04 4 0

PDF文件将不会下载

由于某种原因,我无法下载它,并且内容类型为HTML \ Text,而不是PDF。下载的PDF文件总是很小,当我尝试打开它时,文件已损坏。 import request docke…

当梦初醒 2025-02-03 11:39:42 5 0

用美丽的汤来覆盖动态内容

为了培训我的Python技能,我试图从“ Arbeitsagentur”的Webpresence中删除特定给定工作的开放工作数量noreferrer“> https://www.arbeitsagentur.de/…

沉溺在你眼里的海 2025-02-03 09:48:16 2 0

从excel的电源查询中获取HREF

我正在尝试在搜索“丙酮”时。 当前M代码: let Source = Web.Page(Web.Contents( "https://echa.europa.eu/search-for-chemicals?" & //Parameters "…

青朷 2025-02-03 09:11:21 3 0

如何在我的分析结果以及其他被报废的数据中添加URL

我想一次刮擦许多网站。因此,我希望将URL与被废弃的其他数据一起写入结果。但是我不知道如何。 const puppeteer = require('puppeteer'); (async () …

溺深海 2025-02-03 09:06:14 0 0

单击Selenium中的X按钮

这是我目前正在查看的网站的链接:。滚动到页面底部,然后单击“查看更多”。 我正在尝试弄清楚如何单击X按钮,但是我尝试过的方法尚未奏效。我得到一…

暮光沉寂 2025-02-03 08:53:26 2 0

无法使用Python从JSON页面刮擦数据

我正在尝试从此网页(该网页(向 我可以打印整个页面,但是find_all函数只是返回空白列表。我在做什么错? from bs4 import BeautifulSoup import req…

不念旧人 2025-02-03 08:24:15 4 0

python中的tor ip旋转 - stem.socketerror:[errno 61]连接拒绝

我正在使用Python和Beutifuloup撰写Web Craper。 不久,我的IP就被阻止了。我现在需要旋转我的IP,以便可以连接到网站并刮擦所需的数据。 我主要遵循…

铃予 2025-02-03 07:29:39 3 0

剧作家浏览器启动功能不在Heroku上

我的代码: def check_xyz_status(user_input): user_input_list = user_input.split(',', maxsplit=1) if len(user_input_list) != 2: return f"Inpu…

幽梦紫曦~ 2025-02-03 06:58:44 4 0

元素与硒和python无法相互作用的问题

我的硒是我的新手,而且我一直在运行几个非常小的网络刮擦项目。 当我尝试通过 .click()函数单击此元素时,我一直在获得“不相互作用”的 html部分…

不气馁 2025-02-03 06:19:54 3 0

Web用R刮擦动态网页

我的目标是从此站点获取数据: https://www.insee.fr/fr/recherche?q= emploi-population+active+active+en +2018& amp;taille=20& amp; de…

止于盛夏 2025-02-03 06:15:31 4 0

取消报废之后如何删除跨度标签和类名称,而我只想使用Python刮擦文本

for link in soup.findAll('li'): if "c-listing__authors-list" in str(link): # theAuthor = link.string theAuthor = str(link).replace("","") th…

天涯离梦残月幽梦 2025-02-03 05:41:05 1 0

从html字符串htmlagilitypack c#检索数据

现在,我使用htmlagilitypack从网页中刮除数据, string Name= "ARKU2215462"; string containerInfo = LoadContent(Name); HtmlAgilityPack.HtmlDocu…

Hello爱情风 2025-02-03 05:40:47 3 0

在美丽的小组中如何打印出没有上课或ID的li strong

我有此代码用于废料'1.6.3' Very cheap price & Original product ! Product Version : 1.6.3 Product Last Updated : 08.12.2021 我在li或strong…

烈酒灼喉 2025-02-03 05:36:54 3 0
更多

推荐作者

helenabai_sz

文章 0 评论 0

993438968

文章 0 评论 0

情未る

文章 0 评论 0

纪平伟

文章 0 评论 0

bobowiki

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文