web-scraping

投稿关注

文章 0 浏览 6

抓取 requests.post 方法时出现错误

我正在尝试提取“德里”州办公室的数据。但是，我的代码无法正常工作。我确信我的 python 代码中的数据参数不正确。我已经导入了所有必需的库，例如 p…

稚气少女 2025-01-12 01:34:47 0 0

检查链接之前是否有特定文本（正则表达式）

我试图从实际链接之前包含“Volume”、“Volume 1”或“Volume 1:”的网站中提取所有链接。目前，使用我拥有的代码（如下所示），它将获取所有链接，…

庆幸我还是我 2025-01-12 01:27:16 0 0

如何过滤循环并“保存以供以后使用”结果呢？

我正在尝试为我正在开展的项目抓取亚马逊网站。到目前为止，我已经构建了此流程 driver = webdriver.Chrome(executable_path=r"C:\Users\chromedrive…

小巷里的女流氓 2025-01-12 00:44:26 0 0

网页抓取：我得到了所需的结果，但 get_text 在读取空行时提供错误。有什么想法吗？

import requests from bs4 import BeautifulSoup url = "https://en.wikipedia.org/wiki/List_of_Presidents_of_the_United_States" page = requests.…

恬淡成诗 2025-01-12 00:14:10 0 0

如何使用 selenium 和 python 一次打印 2 个值？

我希望每个人都有美好的一天。我正在尝试从网站中提取值并将它们打印为列表，但我不知道该怎么做。我按预期打印了所有值，只是不知道如何让它们一个接…

橘香 2025-01-11 23:39:25 0 0

从网站列表中抓取返回基于 Xpath 的空结果

因此，我试图从该网站上删除职位列表 https://www.dsdambuster.com/careers。我有以下代码： url = "https://www.dsdambuster.com/careers" page = r…

坏尐絯℡ 2025-01-11 23:32:24 0 0

在 Nightmare.js 中启用 JavaScript

我正在尝试抓取一个具有一些服务器端和一些客户端渲染的网站。不幸的是，在当前设置下，我得到的结果看起来与禁用 JavaScript 后在浏览器中加载页面完…

葵雨 2025-01-11 23:26:15 0 0

Selenium 元素未附加到页面文档

我正在尝试用Python抓取这个特定的网站： https://www .milanofinanza.it/quotazioni/ricerca/listino-completo-2ae?refresh_cens。我需要获取所有 i…

再见回来 2025-01-11 23:12:16 0 0

从 R 中的文本输入框中抓取默认值

我可以在这个网站上抓取表格：- https://dailyfantasynerd.com/optimizer/draftkings/nba 使用 RSelenium 包。问题是上面的带圆圈的列返回为空白：- …

娇俏 2025-01-11 23:08:49 0 0

Selenium (Python) 错误：元素不可交互

我试图从该网站单击此特定的 Web 元素： https: //www.milanofinanza.it/quotazioni/ricerca/listino-completo-2ae?refresh_cens 我尝试了很多不同的…

∞梦里开花 2025-01-11 22:11:38 0 0

如何在没有 React 开发工具的情况下使用 javascript 从浏览器控制台抓取 React 状态？

我正在寻找一种在不使用 React 开发工具的情况下从浏览器控制台捕获/抓取 React Web 应用程序状态数据的方法。…

满天都是小星星 2025-01-11 21:44:24 0 0

列表索引中的 for 循环

我有一个简单但困难的问题，我熟悉 python 中的 for 循环，但当我尝试循环列表索引中的范围时，它给了我一个错误。 for x in range(0,9): fakelist[f'…

只为一人 2025-01-11 21:20:27 0 0

如何使用Python根据时间范围和时间范围抓取reddit数据话题

如何抓取 Reddit 内容/标题来进行情绪分析？我想收集与covid相关的信息以及基于2020年1月1日至2022年3月1日的时间范围。谢谢！…

ぺ禁宫浮华殁 2025-01-11 20:54:56 0 0

获取 iframe 谷歌驱动器内的元素（链接）

我正在尝试以编程方式下载此页面上的两个 zip 文件： https: //sites.google.com/site/ucinetsoftware/datasets/covert-networks/siren 这两个 zip 文…

网白 2025-01-11 20:53:33 0 0

Lineups.com 上的表格是什么格式以及如何在 R 中抓取它

我是抓取新手，并已成功从这些网站抓取表格：- https://www.numberfire.com/nba/daily-fantasy/daily-basketball-projections/guards https://www.dai…

杀お生予夺 2025-01-11 20:47:02 0 0

共 42 页
1
2
3
4
5
下一页

友情链接

文江博客