如果页面有不同的变化,如何在页面中找到文本?
我有一个元素,例如< span class =“ ads_price” id =“ tdo_8”> 7 650€</span> ,我需要按价格找到此元素,但是问题是我不知道价…
为什么我会因Selenium XPath遇到错误
我正在尝试访问我在网站上可以找到的文本的所有实例。 rows = waitForAllElementsToLoad(By.XPATH, "//td[contains(.,'Jones']") def waitForAllEleme…
PDF文件将不会下载
由于某种原因,我无法下载它,并且内容类型为HTML \ Text,而不是PDF。下载的PDF文件总是很小,当我尝试打开它时,文件已损坏。 import request docke…
用美丽的汤来覆盖动态内容
为了培训我的Python技能,我试图从“ Arbeitsagentur”的Webpresence中删除特定给定工作的开放工作数量noreferrer“> https://www.arbeitsagentur.de/…
从excel的电源查询中获取HREF
我正在尝试在搜索“丙酮”时。 当前M代码: let Source = Web.Page(Web.Contents( "https://echa.europa.eu/search-for-chemicals?" & //Parameters "…
如何在我的分析结果以及其他被报废的数据中添加URL
我想一次刮擦许多网站。因此,我希望将URL与被废弃的其他数据一起写入结果。但是我不知道如何。 const puppeteer = require('puppeteer'); (async () …
无法使用Python从JSON页面刮擦数据
我正在尝试从此网页(该网页(向 我可以打印整个页面,但是find_all函数只是返回空白列表。我在做什么错? from bs4 import BeautifulSoup import req…
python中的tor ip旋转 - stem.socketerror:[errno 61]连接拒绝
我正在使用Python和Beutifuloup撰写Web Craper。 不久,我的IP就被阻止了。我现在需要旋转我的IP,以便可以连接到网站并刮擦所需的数据。 我主要遵循…
剧作家浏览器启动功能不在Heroku上
我的代码: def check_xyz_status(user_input): user_input_list = user_input.split(',', maxsplit=1) if len(user_input_list) != 2: return f"Inpu…
Web用R刮擦动态网页
我的目标是从此站点获取数据: https://www.insee.fr/fr/recherche?q= emploi-population+active+active+en +2018& amp;taille=20& amp; de…
取消报废之后如何删除跨度标签和类名称,而我只想使用Python刮擦文本
for link in soup.findAll('li'): if "c-listing__authors-list" in str(link): # theAuthor = link.string theAuthor = str(link).replace("","") th…
从html字符串htmlagilitypack c#检索数据
现在,我使用htmlagilitypack从网页中刮除数据, string Name= "ARKU2215462"; string containerInfo = LoadContent(Name); HtmlAgilityPack.HtmlDocu…
在美丽的小组中如何打印出没有上课或ID的li strong
我有此代码用于废料'1.6.3' Very cheap price & Original product ! Product Version : 1.6.3 Product Last Updated : 08.12.2021 我在li或strong…