第 33 页 - web-scraping

web-scraping

文章 0 浏览 7

如何在JavaScript中使用多个分离器将网站URL拆分？

我正在尝试在Google标签管理器中创建一个自定义的JavaScript变量，以从具有多个分离器的页面URL中拆分信息。例如，在 https://website.com/item.com/i…

简单气质女生网名 2025-02-01 19:41:43 3 0

Google表中的数据

我尝试了以下公式获取PCR数据... =importxml("https://niftyinvest.com/put-call-ratio/MARUTI?expiry=30JUN2022","//span[@class='white-text red da…

爱的故事 2025-02-01 18:30:44 2 0

Python从网站下载NetCDF文件，该网站单击按钮后提供该文件

如果您访问此网站： https://ruc.noaa.gov/raobs/raobs/data_request.cgi？ Byr = 2010＆amp; bmo = 5＆amp; bdy = 26＆amp; bhr = 12＆amp; eyr = 20…

太阳男子 2025-02-01 18:29:57 3 0

响应。文本返回字节和怪异符号

我正在尝试刮擦网站 url ='https://spar.pl/gazetka/spar/'，并尝试使用控制台或VS代码： requests.get(url).text 返回我未知的字节和其他符号。它如…

生寂 2025-02-01 18:12:37 0 0

我如何从查找元素中的黑名单元素？

是否可以像列表中的图像URL一样黑名单元素，以便该程序在下一个搜索中跳过它，不要使用它并在网站上搜索下一个图像？我尝试了这个，但他总是再次采用…

调妓 2025-02-01 17:59:05 1 0

如果“ div name”，我该如何刮擦数据。像这样的“ _ngcontent-jiy-c118”

我尝试； 1） artical_name = soup.find_all（'div'，attrs = {'_ ngcontent-jy-c117 class'：'list-results-items'}） 2） artical_name = sip.find_…

心舞飞扬 2025-02-01 16:42:06 2 0

如何用r刮擦表格名称？

我正在尝试刮擦几个网页，特别是页面中的一些表。但是问题是表的位置相对于每个页面发生了变化。这是我的代码。 url <- paste0("https://en.wikiped…

著墨染雨君画夕 2025-02-01 16:24:31 3 0

尝试使用Selenium刮擦标题

我正在尝试刮擦 title 他们将进入每个链接并刮擦标题，但它们会向我显示错误 from selenium.webdriver.common.by import By from selenium.webdriver.…

很糊涂小朋友 2025-02-01 16:04:12 2 0

为什么硒中的命令可以单独起作用，但是如果在脚本中放置硒，则可以找到元素

我面临的问题是，当我运行整个脚本时，它会抛出元素的错误，无法单击或找不到。当我运行命令时，命令起作用。如果有人能解释原因和为什么它以这种方…

浅唱々樱花落 2025-02-01 12:22:00 2 0

可以在Selenium Python中获取元素的文本

我正在尝试获取一个元素的文本，当我运行它时，它为我提供了一些元素的文字，其中一些元素没有。我不知道为什么会发生这种情况？ # Type and Tags det…

情仇皆在手 2025-02-01 11:49:40 4 0

如何在＆＃x27;查看页面源之间的差异＆＃x27; and document.queryselector（“ html＆quot”）。innerhtml？

我想从此YouTube页面提取字幕（ br> 通过“查看页面源”查找时，我找到了 timedtext 。但是当我通过JavaScript控制台搜索时，不是。它找不到： docum…

秋心╮凉 2025-02-01 10:32:32 1 0

如果以前的元素是x，请返回

我需要为此页面构建一个网络剪贴工具：我已经弄清楚了如何通过使用 present_sibling “vyvěšeno” 和“ sejmuto” /code>，但是现在我需要将所有di…

似狗非友 2025-02-01 10:25:24 1 0

从JSON文件刮擦数据

我正在尝试从JSON文件刮擦 name ，但它们向我显示字符串索引必须是整数，如您所见 JSON文件： "prodBean": { "subProdTerms": null, "friendlyUrl": "…

烦人精 2025-02-01 08:37:52 2 0

BS4：与同一类分开文字-Python

我是第一次网络刮擦，并遇到一个问题：有些课程具有相同的名称。这是代码： testlink = 'https://www.ah.nl/producten/product/wi387906/wasa-volkor…

痴骨ら 2025-02-01 08:23:27 3 0

使用Beautifutsoup从HTML查找文本

我有以下.html： 1.29 s passedThis is the text I want to get 我只需要获得其他所有标签之外的文本（文本是：这是我想要获得的文本）。我试图使用…

断肠人 2025-02-01 08:10:07 2 0

共 138 页
上一页
31
32
33
34
35
下一页

关注

友情链接

文江博客