web-scraping

web-scraping

文章 0 浏览 7

我如何从Facebook页面获取完整帖子的屏幕截图

在此处输入映像说明当我从Facebook页面进行每个帖子的屏幕截图时,我只会得到一个部分缩放后的帖子。 代码: post = browser.find_element_by_xpath("…

不甘平庸 2025-02-09 15:17:38 2 0

使用Python从网站保存文本文件

使用Python,我的任务是简单地从此站点中获取html源代码 - https ://www.cboe.com/us/equities/market_statistics/corporate_action/ - 并将第一个文…

年少掌心 2025-02-09 15:06:38 1 0

无法获得“ myntra”的正确html响应。网站使用requests.get()

我在刮擦“ myntra”网站时遇到了一个问题。我正在尝试刮擦价格和可用性。使用requests.get()时,我在Localhost中获取网站的内容,但无法在Google C…

自由如风 2025-02-09 15:02:48 1 0

AWS lambda -Python Webscraping-无法绕过AWS IP的CloudFare反机器人,但在本地IP中工作

我构建了一个简单的Python Web刮板,该网络刮板在本地可以按预期工作,但在AWS Lambda上不起作用 - 特别是我想刮擦的网站。我仅测试了代码的刮擦部分…

红墙和绿瓦 2025-02-09 14:36:19 3 0

为什么当我尝试刮擦多个页面时,我无法获得所有文本

我正在尝试刮擦多个IMSDB页面,以获取电影脚本以创建电影脚本的数据集。 我编写了此代码, import pandas as pd import numpy as np #import seaborn …

入怼 2025-02-09 13:59:19 1 0

从GraphQl查询中获取JSON响应

我需要从使用GraphQl的该子图中获取一些数据: https://v4.subgraph.polygon.ocean.ocean.oceanprotocol。 com/subgraphs/name/eceanProtocol/ocean-…

相思故 2025-02-09 12:58:47 3 0

Python Selenium Chrome Webdriver错误:无效

我正在应用一个函数,该函数使用硒将URL刮擦到熊猫数据框架上。我正在刮擦许多网站(按10 4 的顺序)。成功刮擦了50个左右的网站后,我得到无效的错误…

半寸时光 2025-02-09 12:28:21 1 0

网站上的刮擦链接无重复

我正在尝试从每个网站上的文本刮擦网站上的所有链接。 现在,我的代码正在创建重复项,其中很多,我想避免。 您能帮忙告诉我我的错误在哪里? 这是我…

伊面 2025-02-09 11:51:20 4 0

Web刮擦转换UNIX时间戳到日期格式

我正在尝试使用Python中的BeautifulSoup对飞行数据网站进行固定,但是时间戳是Unix Timestamp,我如何转换为常规的DateTime格式。有几个这样的列要转…

命硬 2025-02-09 11:47:56 2 0

Web Crapping返回外语,尽管一切都用英语

我对Python中的Web Crapping非常陌生,代码中没有错误,但是OUT似乎是正确的,但是问题在于它的语言是Ouptput。因此,我尝试了IMDB的流行网站。我检查…

傾旎 2025-02-09 07:44:05 3 0

显示错误' WebElement'对象没有属性' startswith'

import time from selenium import webdriver from selenium.webdriver.support import expected_conditions as EC from selenium.webdriver.chrome.s…

北笙凉宸 2025-02-09 07:19:12 2 0

Puppeteer不是点击按钮

我正在尝试使用Puppeteer单击登录表单上的按钮。该表格实际上被渲染为DIV,而不是形式。应该单击以签署我的 OK 按钮没有ID,名称或类型。只是一个类别…

不一样的天空 2025-02-09 07:18:55 0 0

硒定位器仅与Inspect Tab Open一起使用

我正在尝试为与Selenium 4一起工作的项目刮擦名称和赔率,并与定位器遇到问题。 当我使用 driver.find_element(by.xpath)时,我给出的XPath似乎只有…

小伙你站住 2025-02-09 06:01:38 1 0

硒无法通过标签名称找到元素

我正在尝试从网站上进行一些数据刮擦,我需要在某个时候获得某个元素。该元素的名称和ID被动态生成XPATH,CSS_SELECTOR,ID是无法使用的。我正在尝试…

请别遗忘我 2025-02-09 05:53:17 1 0

我如何循环浏览多个页面以使用硒和python下载Excel文件

我正在尝试构建一个网络刮板,该网络刮板将浏览网站的页面,并从页面底部的下拉菜单下载Excel文件。 这些网页仅允许我下载每个页面上显示的50个位置,…

暮年 2025-02-09 05:05:19 2 0
更多

推荐作者

身边

文章 0 评论 0

qq_oxT0yE

文章 0 评论 0

卷着的草席

文章 0 评论 0

£冰雨忧蓝°

文章 0 评论 0

我还不会笑

文章 0 评论 0

Unbroken

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文