web-scraping

web-scraping

文章 0 浏览 7

为什么XPath无法获得目标元素?

我在XPATH上刮擦很新。我正在尝试刮擦目标的产品信息。我使用硒和XPath成功获取价格和名称。但是xpath在刮擦产品大小销售位置。 例如,对于此URL,“ …

滥情空心 2025-02-06 05:46:50 1 0

python -beautifulousoup-如何针对n个孩子并打印文字

我正在尝试在 。我在Div class_ ='SC-1RMT1NR-0 SC-1RMT1NR-2 IMYVIY'中访问第n个孩子(最大获益)' 我设法从“趋势”部分获取数据“最大的获利者”前…

谢绝鈎搭 2025-02-06 05:25:26 1 0

从JavaScript API调用访问数据

Closed. This question needs to be more focused. It is not currently accepting answers. 想要改进此问题?更新该问题,因此它仅针对一个问题,编…

⒈起吃苦の倖褔 2025-02-06 04:50:51 3 0

Python硒未能阅读JS内容?

请注意,此问题仍然打开,因为建议的“答案”仍然给出相同的 输出尝试阅读页面的来源: http://147.235.97.36/ (HP打印机),该(HP打印机)由JS构成…

一身仙ぐ女味 2025-02-06 04:41:29 1 0

使用Python在Web取消过程中未显示的跨度标签中的数字值?

我是网络刮擦的新手。 我正在尝试从 我的代码是: import requests from bs4 import BeautifulSoup as bs url = 'https://www.dailyfx.com/sentiment'…

心欲静而疯不止 2025-02-06 03:53:05 2 0

Python-丹麦国家银行网站的吓汇率数据

我想从丹麦国家银行网站上删除5种货币的汇率数据: https://www.nationalbanken.dk/en/statistics /gexchange_rates/pages/pages/default.aspx ,并将…

陌上青苔 2025-02-06 03:23:37 3 0

网络使用R刮擦嵌入式表

我目前正在研究一个项目,以刮擦此网站上的性能特征表的内容 https://www.ishares.com/uk/individual/en/products/251795/ishares-ftse-ftse-100-ucit…

李白 2025-02-06 02:11:43 2 0

r编程下载.file()返回403禁止错误

以前一直在删除网页,现在它正在返回 403禁止错误。当我通过浏览器手动访问网站时,我没有问题,但是当我刮擦页面时,我会遇到错误。 代码是: url <-…

听你说爱我 2025-02-06 01:16:58 0 0

如何处理空&lt; dt&gt;使用JavaScript进行网络剪接的值

我有一个JavaScript代码,该代码将数据删除在 dl 描述列表中。 有7 dt 值具有相应的 dd 值。 在网站上显示至少1 dd 值的7 dt 值的值至少具有1 dd 值 -…

妄断弥空 2025-02-05 23:50:25 0 0

Selenium Python -Text()与XPath一起使用,但与CSS_SELECTOR无关

我正在尝试在魁北克网站上为房屋上市网站进行封存,但我遇到了一个问题。 当我使用XPATH时,我设法提取电话号码,但是当我使用CSS选择器时,我的变量…

会傲 2025-02-05 20:57:17 2 0

我如何使用硒接受这些饼干?

我正在尝试刮擦此网站 https://www.parkers.co.uk 但是对于某些原因我似乎无法超越cookie弹出,我尝试了此代码 cookies = driver.find_element_by_xpa…

对岸观火 2025-02-05 20:48:24 1 0

美丽的汤问题 - 可以找到正确的问题

我遇到美丽的汤遇到麻烦。我正在尝试刮擦皮划艇,但是当我打印find_all的长度时,它正在返回0。我也将硒与美丽的汤一起使用。 from selenium import w…

少年亿悲伤 2025-02-05 20:38:02 3 0

在XPath -Selenium-初学者中使用卷曲括号

我正在使用硒,并想通过XPATH识别元素。我想使用的是这样的定位器: ref_code = driver.find_elements_by_xpath("//tr[@data-eui-handler="{ event:'c…

放我走吧 2025-02-05 19:49:08 1 0

请求HTML没有获得完整的HTML

我有以下 response=requests.get(item_url,headers=headers).text soup=BeautifulSoup(response,'lxml') print(soup) product=soup.find_all('a',clas…

打小就很酷 2025-02-05 18:54:33 1 0

有OnClick事件按钮时刮擦数据

我正在尝试从“ https://lol.inven.co.kr/dataninfo/match/teamlist.php”中刮擦数据(对不起,网站不使用英语) 当我不clikc时,该网站没有“详细图…

却一份温柔 2025-02-05 17:39:29 3 0
更多

推荐作者

Mr.HU

文章 0 评论 0

疯到世界奔溃

文章 0 评论 0

隔纱相望

文章 0 评论 0

萌无敌

文章 0 评论 0

梦幻的味道

文章 0 评论 0

自在安然

文章 0 评论 0

更多

友情链接

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文