使用r-我想从网站提取一些表格数据
我在网站上刮擦数据时遇到了一些问题。我在网上剪贴式上没有很多经验。我的预期计划是使用以下网站的R刮擦一些数据: https://www.fatf---fatf--- ga…
Scarpy无法刮擦简单的网站,因为它提供了空数据
我正在努力关注网站但是我遇到了奇怪的错误,因为所有表数据都是空的,因为所有表数据都是空的。 以下是我简单的砂纸代码。 class FloorSheetSpider(s…
带有请求标头的废料图像在美丽的套件上
我有用于废料映像的代码: import requests, base64 from bs4 import BeautifulSoup baseurl = "https://www.google.com/search?q=cat&sxsrf=APq-WBuy…
剧作家 - 派恩(Python)并行刮擦URL列表
我有一个URL列表。在列表上迭代时,每个URL使用 context.new_page()。goto(url)使用新页面打开。我想打开多个页面并并行刮擦。 注意:每个新页面…
如何通过使用document.location.href的php curl重定向?
我正在尝试刮擦通常使用浏览器打开的网站。但是,每当我使用卷发打开链接时,我都会进入一个中间重定向页面,该页面显示“重定向...请等待。” 我的代…
i和跨度标签的刮擦值
我试图从以下代码中刮除发布日期和下载次数。 Release date : 2022-06-02 Downloads : 703 这是我的功能 def phone_data(url): r = requests.get(url)…
新手,刮擦问题,futbin网络刮擦问题
我是网络刮擦的新手,我正试图通过futbin(fut 22)播放器数据库刮擦 “ https://www.futbin.com/players”。我的代码在下面,我不知道为什么如果无法…
清理网络刮擦数据并组合在一起?
网站 url 是 https://wwww.justia.com /律师/刑法/缅因州 我想只刮擦律师的名字以及他们的办公室。 response = requests.get(url) soup= BeautifulSou…
以这些格式从JSON中提取数据
我一直在与JSON搞砸了一段时间,只是将其推出为文字,但并没有伤害任何人(我知道),但我想开始正确地做事。 这是我的代码: term=temp['specificati…
零工选择器仅获取第一个元素以进行循环
我不明白为什么在使用废品选择器时以下代码不起作用。 在砂壳中(很容易复制,但是蜘蛛中的问题仍然相同): from scrapy.selector import Selector b…
Python卡在第1页
Closed. This question needs debugging details. It is not currently accepting answers. 编辑问题以包括所需的行为,特定问题或错误以及重现问题…