如何在JavaScript中使用多个分离器将网站URL拆分?
我正在尝试在Google标签管理器中创建一个自定义的JavaScript变量,以从具有多个分离器的页面URL中拆分信息。例如,在 https://website.com/item.com/i…
Google表中的数据
我尝试了以下公式获取PCR数据... =importxml("https://niftyinvest.com/put-call-ratio/MARUTI?expiry=30JUN2022","//span[@class='white-text red da…
Python从网站下载NetCDF文件,该网站单击按钮后提供该文件
如果您访问此网站: https://ruc.noaa.gov/raobs/raobs/data_request.cgi? Byr = 2010& bmo = 5& bdy = 26& bhr = 12& eyr = 20…
响应。文本返回字节和怪异符号
我正在尝试刮擦网站 url ='https://spar.pl/gazetka/spar/', 并尝试使用控制台或VS代码: requests.get(url).text 返回我未知的字节和其他符号。它如…
如果“ div name”,我该如何刮擦数据。像这样的“ _ngcontent-jiy-c118”
我尝试; 1) artical_name = soup.find_all('div',attrs = {'_ ngcontent-jy-c117 class':'list-results-items'}) 2) artical_name = sip.find_…
如何用r刮擦表格名称?
我正在尝试刮擦几个网页,特别是页面中的一些表。 但是问题是表的位置相对于每个页面发生了变化。 这是我的代码。 url <- paste0("https://en.wikiped…
尝试使用Selenium刮擦标题
我正在尝试刮擦 title 他们将进入每个链接并刮擦标题,但它们会向我显示错误 from selenium.webdriver.common.by import By from selenium.webdriver.…
为什么硒中的命令可以单独起作用,但是如果在脚本中放置硒,则可以找到元素
我面临的问题是,当我运行整个脚本时,它会抛出元素的错误,无法单击或找不到。当我运行命令时,命令起作用。 如果有人能解释原因和为什么它以这种方…
可以在Selenium Python中获取元素的文本
我正在尝试获取一个元素的文本,当我运行它时,它为我提供了一些元素的文字,其中一些元素没有。我不知道为什么会发生这种情况? # Type and Tags det…
如何在&#x27;查看页面源之间的差异&#x27; and document.queryselector(“ html&quot”)。innerhtml?
我想从此YouTube页面提取字幕( br> 通过“查看页面源”查找时,我找到了 timedtext 。 但是当我通过JavaScript控制台搜索时,不是。它找不到: docum…
如果以前的元素是x,请返回
我需要为此页面构建一个网络剪贴工具: 我已经弄清楚了如何通过使用 present_sibling “vyvěšeno” 和“ sejmuto” /code>,但是现在我需要将所有di…
从JSON文件刮擦数据
我正在尝试从JSON文件刮擦 name ,但它们向我显示字符串索引必须是整数,如您所见 JSON文件: "prodBean": { "subProdTerms": null, "friendlyUrl": "…
BS4:与同一类分开文字-Python
我是第一次网络刮擦,并遇到一个问题:有些课程具有相同的名称。 这是代码: testlink = 'https://www.ah.nl/producten/product/wi387906/wasa-volkor…
使用Beautifutsoup从HTML查找文本
我有以下.html: 1.29 s passedThis is the text I want to get 我只需要获得其他所有标签之外的文本(文本是:这是我想要获得的文本)。 我试图使用…