如何在美丽的小组中保留订单?
我正在使用美丽的肥皂来提取网页中的可见文本,因此我尝试实现以下解决方案: def filter_visible_texts(element): if element.parent.name in ['styl…
木偶 - 有时会出现新错误
我尝试使用Puppeteer进行一些网络报废,我的脚本工作,但有时在理解中没有理由的情况下,我会遇到此错误: file:///C:/Users/aemba/OneDrive/Bureau/n…
Wikipedia页面的刮擦小节
我正在尝试使用Python在Wikipedia页面的小节中刮擦链接。例如,此处: https://en.wikipedia.org/wiki/wiki/lists_of_video_game_games 仅根据“类型…
Python Beautifulsoup HTML解析器不起作用
在这里,我正在尝试阅读页面并分别使用列创建CSV。但是我无法阅读解析数据以使用查找功能。汤数据没有网页中存在的数据 import requests import panda…
美丽的汤网刮擦返回非毕顿
我有一个想从Google删除流派的电影列表。 我已经构建了此代码: import requests from bs4 import BeautifulSoup list=['Se7en','Cinema Paradiso','T…
Webing HTTP错误时的Python错误403:禁止
我是初学者,并试图从国会记录中进行韦克斯克雷普。我有一个我想下载的网站的.txt文件(url_list.txt)。 .txt文件数据看起来像这样: https://www.co…
如何在复杂的嵌套JSON中解决关键错误
我不断收到关键错误“笔记”。笔记处于嵌套响应中。我该如何解决?我包括了JSON的样本。 通过请求添加了追溯。 Traceback (most recent call last): F…
从rvest中刮下临床的数据表
当我在 https://clinicaltrials.gov/ct2/results?term = nivolumab+and+voserall+survival 。请参阅下面的屏幕截图: 我已经尝试了此代码,但是我认…
硒 - 迭代分页地点,有额外的随机数
我想刮擦的网站是分页的,但我不能仅迭代页面,因为每个下一页都有一些额外的随机数。 这是页面: https://market.biset.burset.burset.bursnis.com/…
Selenium Webdriver VBA-新循环错误
晚安, 如果可能的话,我希望一些帮助。我将此代码放在一起,但是如果找不到页面项目,我将无法创建输出。我希望,如果他没有找到Intem,他会去下一行…