web-scraping

web-scraping

文章 0 浏览 7

从HTML代码中删除URL和描述

我是编码的新手,我正在努力从HTML代码的块返回多个URL和描述。我知道我必须以某种方式循环,但不知道如何循环。希望有人可以帮助我。我所拥有的是 fu…

锦爱 2025-02-07 12:09:34 4 0

可以使用请求模块从静态网页中刮擦信息

我正在尝试获取产品标题,并且它是网页使用请求模块。标题和描述似乎是静态的,因为它们都存在于页面源中。但是,我没有尝试使用以下尝试来抓住它们。…

陪我终i 2025-02-07 10:55:41 1 0

如何将数据刮入Excel文件

https://m-selig.ae.illinois.illinois.ellinois.edu/ads/ads/ COORD/AG25.DAT 我正在尝试从UIUC机翼数据库网站刮擦数据,但是所有链接的格式都不同…

暗恋未遂 2025-02-07 10:45:31 1 0

apefify如何停止在浏览器中打开新页面的Enqueuelink函数

我正在尝试从页面获得链接,然后通过单击按钮导航到下一页。问题是我首先需要将第一页上的所有链接添加到队列中,但是当我尝试单击元素时,Enqueuelis…

水溶 2025-02-07 08:47:21 3 0

如何从美丽的群岛中提取Li?

我知道这个问题似乎很基本,但我似乎无法从给定的ULS中提取LI和文本。 https://solar.world.org/reuse/aluminum.foil 这是这里我想提取的URL。我尝试…

じ违心 2025-02-07 08:31:03 0 0

每当我更改解析功能零食时,都不起作用并引发错误?

from scrapy import Spider from selenium import webdriver from scrapy.selector import Selector from scrapy.http import Request from selenium.…

你又不是我 2025-02-07 08:26:56 2 0

如何在美丽的套件中与一个标签分开获取不同的文本?

我正在尝试从此Wikipedia页面上刮擦迪士尼电影的数据: 这是我的代码: import pandas as pd from bs4 import BeautifulSoup as bs import requests u…

第七度阳光i 2025-02-07 08:00:00 1 0

如何用同一班级刮擦另一个跨度

我正在使用BeautifureSoup4,这是我的代码: def extract(page): url = f'https://www.jobstreet.com.my/en/job-search/personal-assistant-jobs/{pag…

家住魔仙堡 2025-02-07 07:47:09 1 0

我一直在尝试对亚马逊产品评论的网络刮擦,但是数据没有从下一页获取数据

Closed. This question is not reproducible or was caused by typos. It is not currently accepting answers. 这个问题是由类错字或无法再现的问题…

坚持沉默 2025-02-07 06:51:36 0 0

查看视频元素的来源

我想获取原始视频数据。我试图检查它,但没有SRC属性。 正常页面: 正常页面 A page with only a video element…

‖放下 2025-02-07 06:39:50 1 0

importxml函数不适合此页面

我正在尝试进行个人搜索,并希望从boardgamegeek网站的单游戏页面( https://boardgamegeek.com/boardgame/174430/gloomhaven )。 不幸的是,ImportX…

月下伊人醉 2025-02-07 05:35:22 1 0

获取属性'尝试刮擦网页时

我目前正在研究一个愚蠢的项目,以测试我的Python技能。我希望能够刮擦彩票游戏并进行分析以测量模式。 目标: 刮擦数字历史记录。包括日期。 将数据…

烟燃烟灭 2025-02-07 05:11:10 1 0

Python-无法将刮擦XML文件(从sec.gov)的结果转换为RAW字节

我正在尝试从sec.gov刮擦XML文件,然后将其转换为一个长字符串,但是它只是返回一堆字符串的一堆地址,我不知道如何将其作为字符串返回,或可以转换为…

記柔刀 2025-02-07 04:56:00 1 0

getElementsById-对象相关错误Excel VBA

我正在研究一个项目,以从Realtor.com导入特定的房地产列表信息到Excel。该代码应访问Cell A1中清单的链接,并返回该物业在C1中构建的一年。我可以使…

◇流星雨 2025-02-07 03:50:51 1 0

从Python中读取CSV文件的URL时编码问题

我有一个带有一些URL的CSV文件;阅读后,在Python中使用: import csv rows = [] with open("links.csv","r", encoding = "utf-8") as c: csv_reader …

风吹雪碎 2025-02-07 03:26:53 1 0
更多

推荐作者

Mr.HU

文章 0 评论 0

疯到世界奔溃

文章 0 评论 0

隔纱相望

文章 0 评论 0

萌无敌

文章 0 评论 0

梦幻的味道

文章 0 评论 0

自在安然

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文