web-scraping

web-scraping

文章 0 浏览 7

试图发表简单的帖子并获取请求,仍然会出现错误

我试图刮擦网页,但无法访问使用该服务动态加载的端点。我检查了网络选项卡并找到了服务,并试图模拟请求,获取错误 在这里输入映像说明 尝试使用具有…

遗心遗梦遗幸福 2025-01-31 09:35:18 3 0

同一表中多个行的XPath

我正在尝试为刮刀编写XPath。这是表中的第一行的给定XPATH:/html/hody/div [3]/div/div/div [2]/div [8]/div/div/table/tbody/tr [1] 我只需要提取与…

划一舟意中人 2025-01-31 09:00:41 3 0

如何用Java有效地解析HTML?

我在工作中进行了很多HTML解析。到目前为止,我一直在使用HTMLUNIT无头浏览器来解析和浏览器自动化。 现在,我想分开两个任务。 我想使用轻型HTML解析…

太阳公公是暖光 2025-01-31 08:29:48 3 0

如何在弹出窗口中将硒链接到webccrape的第二页。

我正在尝试为各种结果覆盖。第一页工作正常,但是当我切换到下一页时,不幸的是,它只是再次将结果的第一页网络覆盖。结果不会返回新的URL,因此它不…

温柔戏命师 2025-01-31 07:45:43 2 0

网络剪贴后,将文本写给CSV

我正在通过刮擦提取房地产数据。我希望这些数据在CSV文件中。 当我将数据写入CSV时,如果第一次刮擦的项目没有我需要的值,它只会跳过所有行(但其他…

不羁少年 2025-01-31 07:33:10 1 0

Python Beautifulsoup未能从某个类别的DIV获取数据

我正在制作一个程序,该程序将从图书馆中刮擦Metacritic以获取电影中的信息并显示它,但是在某些部分(例如抓住评分总是什么都没有返回我)我在做什么…

烈酒灼喉 2025-01-31 05:17:20 3 0

python网络剪贴总是什么都不是或主页数据

检查参数后,我一直在尝试从网站获取数据 url = 'https://ytbsbilgi.teias.gov.tr/ytbsbilgi/frm_istatistikler.jsf' ,我知道我需要 javax.faces.Vie…

若无相欠,怎会相见 2025-01-31 04:23:48 2 0

试图使用python上的硒滚动弹出弹出式弹出弹出时,对象无法相互作用

我需要向下滚动以下链接中出现的弹出窗口 https://www.vivino.com/it/en/en/rronchi-di-cialla-picolit-di-cialla/w/2015576?year=2011&pprice_i…

╰つ倒转 2025-01-31 04:23:02 1 0

网络刮擦返回一个空列表

import requests from bs4 import BeautifulSoup result = requests.get('https://www.indeed.com/?vjk=5bc59746be36d8d0') source = result.content…

安静 2025-01-31 03:42:50 1 0

如何使用Shadow-root网站中的产品元素加速?

我是Python的新手,我正在尝试学习。我目前正在一个具有阴影根部的网站上进行网络刮擦项目,但是我在访问Shadow-root下的元素方面遇到了困难。我真的…

罗罗贝儿 2025-01-31 03:23:35 4 0

如何从R中的一行中进行多行?

我目前有一个数据集,该数据集在一排中包含所有信息(如果我转置)。 The very first items in the data are actually column names: Country Populat…

灼痛 2025-01-31 03:08:28 2 0

我该如何自动扩展整个网页以用pandas(Python)刮擦?

我正在尝试从 https://coinmarketcap.com/exchanges/exchanges/binance/binance/ )。在页面上,有一个“负载更多”按钮。单击此点时,将显示更多的行…

洋洋洒洒 2025-01-31 02:50:03 1 0

搜索重复字符并将其从数组JS中删除

我有多个随机阵列,从刮擦网站的数组中。 我想知道我是否可以搜索一个数组并删除数组中的重复html arr = [{ "post_title": "When Climate and Energy …

↘人皮目录ツ 2025-01-31 02:42:29 2 0

从Spotify下载的音频CDN在10秒后保持沉默

我正在尝试从Spotify CDN链接中获取Spotify音频: 。 但下载 image1 image2 因此,决定使用python请求模块在标题中设置 range ,但也行不通: import …

何时共饮酒 2025-01-31 02:36:47 3 0

使用Selenium运行脚本后,无限页面加载

我正在尝试刮擦网站。硒的第一个请求始终可以工作,但是一旦运行第二个请求,页面就会无限加载。我所能做的就是手动停止页面,以便其余的请求继续正常…

樱花坊 2025-01-31 02:32:21 0 0
更多

推荐作者

达拉崩吧

文章 0 评论 0

PANGOO

文章 0 评论 0

kkgtx

文章 0 评论 0

WordPress小学生

文章 0 评论 0

酷炫老祖宗

文章 0 评论 0

硪扪都還晓

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文