用< br>替换线路断裂;在标签中使用美丽的小组
我想使用 beautifure 来解析一些 html ,然后替换< blockQuote> 带有< br> 标签的标签。这是非常困难的,因为< blockQuote> …
python selenium-如何根据跨度标签中的文本提取元素?
我正在从url https://blinkit.com/prn com.com/prn-prn-prn-prn-prn/prn-prn/prn-prn/prn-prn/prn-com/prn-prn/prn-com/prn-com-com/prn一下,我正在…
使用美丽的汤在Div中获取物品列表
我正在尝试使用美丽的汤来从a from bs4 import BeautifulSoup page = requests.get("https://www.udacity.com/courses/all?price=Free",verify=False)…
无头可以使用剧作家和美丽的人4
此代码正在工作: from playwright.sync_api import sync_playwright from bs4 import BeautifulSoup from datetime import datetime import time wit…
如何检查al< li>标签包括AN< img>标记,然后运行代码(如果存在)
我进行了一个网络刮擦项目。有一个UL标签,其中包括几个LI标签。我的任务是仅当特定LI标签组成IMG标签时,才打印LI标签的内容。我无法做到。不知道我…
如何修复” TypeError:列表索引必须是整数或切片,而不是str。 &quot?
我正在尝试刮擦网站。我希望能够从此网页检索一个URL链接,并使用它到达另一个页面,在这里我可以访问所需的此信息。 import requests from bs4 impor…
返回使用Beautifoulsoup的特定标题关键字
我正在尝试创建一个网络刮板,仅当标题中的RSS feed(XML格式)中有某个关键字时,才能返回文章。但是,每当我运行代码时,它也会返回空白,即使文章…
如何从Inc5000中刮擦公司名称?
我正在尝试从Inc5000站点(“ https://www.inc.com/inc5000/2021”刮擦所有公司名称)。问题是公司名称是使用JavaScript显示的。我已经尝试使用硒和请…
用JSON刮擦多个页面
我正在尝试用JSON刮擦多个页面,但它们会为我提供错误 import requests import json import pandas as pd headers = { 'Accept-Language': 'en-GB,en-…
如何使用Python获取桌子的身体?
我正在自我播放的网络crap绕,我正试图从一个美丽的小屋的桌子上拿到tbody。 我的尝试: url ='https://www.agrolok.pl/notowania/notowania-cen-psze…
如何修复我的Python代码以查找跨多个URL的事件,而不仅仅是一个
Closed. This question needs details or clarity. It is not currently accepting answers. 想要改进此问题吗?添加详细信息并通过 闭合 2年前。…