web-scraping

web-scraping

文章 0 浏览 7

如何在JavaScript中使用多个分离器将网站URL拆分?

我正在尝试在Google标签管理器中创建一个自定义的JavaScript变量,以从具有多个分离器的页面URL中拆分信息。例如,在 https://website.com/item.com/i…

简单气质女生网名 2025-02-01 19:41:43 3 0

Google表中的数据

我尝试了以下公式获取PCR数据... =importxml("https://niftyinvest.com/put-call-ratio/MARUTI?expiry=30JUN2022","//span[@class='white-text red da…

爱的故事 2025-02-01 18:30:44 2 0

Python从网站下载NetCDF文件,该网站单击按钮后提供该文件

如果您访问此网站: https://ruc.noaa.gov/raobs/raobs/data_request.cgi? Byr = 2010& bmo = 5& bdy = 26& bhr = 12& eyr = 20…

太阳男子 2025-02-01 18:29:57 3 0

响应。文本返回字节和怪异符号

我正在尝试刮擦网站 url ='https://spar.pl/gazetka/spar/', 并尝试使用控制台或VS代码: requests.get(url).text 返回我未知的字节和其他符号。它如…

生寂 2025-02-01 18:12:37 0 0

我如何从查找元素中的黑名单元素?

是否可以像列表中的图像URL一样黑名单元素,以便该程序在下一个搜索中跳过它,不要使用它并在网站上搜索下一个图像? 我尝试了这个,但他总是再次采用…

调妓 2025-02-01 17:59:05 1 0

如果“ div name”,我该如何刮擦数据。像这样的“ _ngcontent-jiy-c118”

我尝试; 1) artical_name = soup.find_all('div',attrs = {'_ ngcontent-jy-c117 class':'list-results-items'}) 2) artical_name = sip.find_…

心舞飞扬 2025-02-01 16:42:06 2 0

如何用r刮擦表格名称?

我正在尝试刮擦几个网页,特别是页面中的一些表。 但是问题是表的位置相对于每个页面发生了变化。 这是我的代码。 url <- paste0("https://en.wikiped…

著墨染雨君画夕 2025-02-01 16:24:31 3 0

尝试使用Selenium刮擦标题

我正在尝试刮擦 title 他们将进入每个链接并刮擦标题,但它们会向我显示错误 from selenium.webdriver.common.by import By from selenium.webdriver.…

很糊涂小朋友 2025-02-01 16:04:12 2 0

为什么硒中的命令可以单独起作用,但是如果在脚本中放置硒,则可以找到元素

我面临的问题是,当我运行整个脚本时,它会抛出元素的错误,无法单击或找不到。当我运行命令时,命令起作用。 如果有人能解释原因和为什么它以这种方…

浅唱々樱花落 2025-02-01 12:22:00 2 0

可以在Selenium Python中获取元素的文本

我正在尝试获取一个元素的文本,当我运行它时,它为我提供了一些元素的文字,其中一些元素没有。我不知道为什么会发生这种情况? # Type and Tags det…

情仇皆在手 2025-02-01 11:49:40 4 0

如何在&#x27;查看页面源之间的差异&#x27; and document.queryselector(“ html&quot”)。innerhtml?

我想从此YouTube页面提取字幕( br> 通过“查看页面源”查找时,我找到了 timedtext 。 但是当我通过JavaScript控制台搜索时,不是。它找不到: docum…

秋心╮凉 2025-02-01 10:32:32 1 0

如果以前的元素是x,请返回

我需要为此页面构建一个网络剪贴工具: 我已经弄清楚了如何通过使用 present_sibling “vyvěšeno” 和“ sejmuto” /code>,但是现在我需要将所有di…

似狗非友 2025-02-01 10:25:24 1 0

从JSON文件刮擦数据

我正在尝试从JSON文件刮擦 name ,但它们向我显示字符串索引必须是整数,如您所见 JSON文件: "prodBean": { "subProdTerms": null, "friendlyUrl": "…

烦人精 2025-02-01 08:37:52 2 0

BS4:与同一类分开文字-Python

我是第一次网络刮擦,并遇到一个问题:有些课程具有相同的名称。 这是代码: testlink = 'https://www.ah.nl/producten/product/wi387906/wasa-volkor…

痴骨ら 2025-02-01 08:23:27 3 0

使用Beautifutsoup从HTML查找文本

我有以下.html: 1.29 s passedThis is the text I want to get 我只需要获得其他所有标签之外的文本(文本是:这是我想要获得的文本)。 我试图使用…

断肠人 2025-02-01 08:10:07 2 0
更多

推荐作者

5040234068

文章 0 评论 0

樱花雨梦

文章 0 评论 0

≈。彩虹

文章 0 评论 0

雨轻弹

文章 0 评论 0

血之狂魔

文章 0 评论 0

qq_0bIjwE

文章 0 评论 0

更多

友情链接

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文