web-scraping

web-scraping

文章 0 浏览 7

如何在美丽的小组中保留订单?

我正在使用美丽的肥皂来提取网页中的可见文本,因此我尝试实现以下解决方案: def filter_visible_texts(element): if element.parent.name in ['styl…

蓝眸 2025-02-10 00:58:14 1 0

木偶 - 有时会出现新错误

我尝试使用Puppeteer进行一些网络报废,我的脚本工作,但有时在理解中没有理由的情况下,我会遇到此错误: file:///C:/Users/aemba/OneDrive/Bureau/n…

眼中杀气 2025-02-10 00:36:18 1 0

Wikipedia页面的刮擦小节

我正在尝试使用Python在Wikipedia页面的小节中刮擦链接。例如,此处: https://en.wikipedia.org/wiki/wiki/lists_of_video_game_games 仅根据“类型…

独孤求败 2025-02-09 23:55:39 1 0

亚马逊网络刮板

在此网络刮板上工作, const express = require("express"); const request = require("request-promise"); const app = express(); const PORT = pro…

千と千尋 2025-02-09 23:12:10 0 0

我如何循环浏览多个页面以刮擦表数据(Python)

我正在努力寻找一种循环浏览页面并从表格上刮擦数据的方法 - 我设法从第一页获取数据,但我不知道如何继续浏览每个页面并获取数据。我尝试了各种不同…

笨死的猪 2025-02-09 20:52:28 2 0

玻璃门报废(硒),python

我正在尝试刮擦玻璃门,在执行代码时,没有错误,网站打开了,但随后什么也没有发生。我尝试更改标签,但仍在工作。 问题是我想单击第一个选定的作业…

你是年少的欢喜 2025-02-09 20:18:11 2 0

Python Beautifulsoup HTML解析器不起作用

在这里,我正在尝试阅读页面并分别使用列创建CSV。但是我无法阅读解析数据以使用查找功能。汤数据没有网页中存在的数据 import requests import panda…

べ繥欢鉨o。 2025-02-09 20:13:03 2 0

检查网站是否具有Python的内容长度

我想编写一个脚本,该脚本将所有IP地址贴在文件中,并显示服务器名称和内容长度的状态。 现在,有些网站不显示内容长度,如果不存在的话,我想编写下…

稀香 2025-02-09 19:57:45 3 0

美丽的汤网刮擦返回非毕顿

我有一个想从Google删除流派的电影列表。 我已经构建了此代码: import requests from bs4 import BeautifulSoup list=['Se7en','Cinema Paradiso','T…

转身以后 2025-02-09 19:02:58 1 0

Webing HTTP错误时的Python错误403:禁止

我是初学者,并试图从国会记录中进行韦克斯克雷普。我有一个我想下载的网站的.txt文件(url_list.txt)。 .txt文件数据看起来像这样: https://www.co…

欢烬 2025-02-09 18:53:18 1 0

如何在复杂的嵌套JSON中解决关键错误

我不断收到关键错误“笔记”。笔记处于嵌套响应中。我该如何解决?我包括了JSON的样本。 通过请求添加了追溯。 Traceback (most recent call last): F…

傾城如夢未必闌珊 2025-02-09 18:35:24 1 0

从rvest中刮下临床的数据表

当我在 https://clinicaltrials.gov/ct2/results?term = nivolumab+and+voserall+survival 。请参阅下面的屏幕截图: 我已经尝试了此代码,但是我认…

朱染 2025-02-09 17:43:04 2 0

仅刮擦1页不刮擦多个页面

他们只会刮擦1页的数据,只能在第二页上移动是任何解决方案,然后给我提供不同的批准,但是如果有任何解决方案,我就不会成功解决这些问题://www.ife…

我的黑色迷你裙 2025-02-09 16:58:52 4 0

硒 - 迭代分页地点,有额外的随机数

我想刮擦的网站是分页的,但我不能仅迭代页面,因为每个下一页都有一些额外的随机数。 这是页面: https://market.biset.burset.burset.bursnis.com/…

烈酒灼喉 2025-02-09 16:27:57 2 0

Selenium Webdriver VBA-新循环错误

晚安, 如果可能的话,我希望一些帮助。我将此代码放在一起,但是如果找不到页面项目,我将无法创建输出。我希望,如果他没有找到Intem,他会去下一行…

初见 2025-02-09 15:41:13 1 0
更多

推荐作者

闻呓

文章 0 评论 0

深府石板幽径

文章 0 评论 0

mabiao

文章 0 评论 0

枕花眠

文章 0 评论 0

qq_CrTt6n

文章 0 评论 0

红颜悴

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文