我需要帮助获得每个页面的链接
我正在尝试从 url = 'https://apexranked.com/' page = 1 while page != 121: url = f'https://apexranked.com/?page={page}' print(url) page = page…
可以使用Puppeteer -Thingiverse单击链接单击链接
我正在尝试自动化在Thingiverse上下载多个文件的自动化。我随机选择一个对象。但是我很难找到所需的链接,单击然后下载。有人遇到过我可以得到一些帮…
如何使用JSOUP网络刮擦Android中的动态页面
我正在尝试网络刮擦网站 savevideo.tube.tube 使用jsoup。 当我们在搜索栏中放置链接并单击搜索按钮时,网站会动态加载并显示一些我想刮擦的下载链接…
如何读取URL的文件和Web用多线程刮擦它们
我正在python中实现网络刮擦脚本,该脚本读取JSON文件,并获取一个网址列表以刮擦每个文件。 该文件包含超过60k行,其中约50k是唯一的(因此首先我要…
未能在具有多链接的网站中使用Webccrape标题和作者
我正在尝试将此 link 。例如,我只想刮擦第一页。我想为您在第一页中找到的10个链接中的每个链接中收集标题和作者。 为了收集标题和作者,我编写了以…
与美丽的小组及其隔离刮擦&硒
我正在尝试从HREF获取“ Master_key”。有人可以帮助我隔离文字中的钥匙吗?理想情况下,我将能够运行一个find_all并获得所有可用的find_all。谢谢!…
用< br>替换线路断裂;在标签中使用美丽的小组
我想使用 beautifure 来解析一些 html ,然后替换< blockQuote> 带有< br> 标签的标签。这是非常困难的,因为< blockQuote> …
python:报废网站的字符串/列表值
我试图从以下方式构成以下方式的网站上获取值列表: SIZE_1317058 size XS 这将为网站上所有可用的尺寸重复。 我使用以下代码: all_sizes = [] for v…
QuerySelectorall也选择儿童课程
示例 - 在Chrome DevTools上 document.queryselectorall(“。Main”) selects&主要孩子。 我如何仅选择主?…
Selenium Web刮擦给了我错误的行,我在哪里做错了?
您好,我是网站报废网站, 这是我的代码 from selenium import webdriver from selenium.webdriver.chrome.service import Service from selenium.web…
python selenium-如何根据跨度标签中的文本提取元素?
我正在从url https://blinkit.com/prn com.com/prn-prn-prn-prn-prn/prn-prn/prn-prn/prn-prn/prn-com/prn-prn/prn-com/prn-com-com/prn一下,我正在…
使用帖子方法刮擦多个页面
import scrapy from scrapy.http import Request from scrapy.selector import Selector from selenium import webdriver import time from scrapy_se…
为什么Facebook的MBASIC版本仅为成员部分的3个深度?
我知道这不是编程,但我在Facebook中没有为开发人员找到任何API。因此,我正在使用Facebook的基本版本。但是问题是,我不能超过三页Facebook组成员。 …
试图导入总YouTube频道视图时,电子表格中的importxml正在返回错误
我正在尝试制作一个电子表格,该电子表格从YouTube频道“大约”页面中获取数据,以获取该频道的订阅者和视图。 例如,要导入视图,我正在使用: =IMPO…
我试图为变量提供路径,以便可以刮擦该路径中包含的信息。但是,我得到空名单
我正在尝试使用Python制作Web Scraper,而我在这里使用的基本概念是 创建空列表 - >使用“ for Loop”循环通过网页上的元素。 - >在空列表中…