如何防止美丽的小组编码逃脱的角色
正如该问题中提到的那样 - 我希望Beautifulsoup将原始角色保留在HTML中,而不是更换它们。简单示例: soup1 = BeautifulSoup( "APOLLOE4: Early Alzhe…
我只能从#0-9和az'中选择链接。在美丽的小组?
我的URL是这个 https:> https:// https: /在选择从A到Z的所有链接时。 link = s.get(url) link_soup = BeautifulSoup(link.text, 'lxml') links = …
如何在每个元素中迭代?
import requests from bs4 import BeautifulSoup url = "https://bigpara.hurriyet.com.tr/borsa/hisse-fiyatlari/" r = requests.get(url) soup = Be…
用美丽的小组编写的简单代码不起作用
我试图学习美丽的汤。我在视觉代码中运行以下代码。但是没有成功的答案。终端没有显示错误。 from bs4 import BeautifulSoup import requests url = "…
需要帮助正确地提取信息
from bs4 import BeautifulSoup import requests from datetime import datetime from dateutil.relativedelta import relativedelta evr_begin = dat…
硒和美丽的小组更改html元素内的数字
我想提取每个团队从网站获得的黄牌数量 这是我的代码 driver = webdriver.Chrome(service=chrome_driver_path) driver.get("https://www.premierleagu…
如何使用Beautifulsoup在IMDB的演出中提取演员?
我正在尝试使用BeautifulSoup提取办公室的演员列表来刮擦此IMDB页 https://www.imdb.com/title/tt0386676/fullcredits/?ref_=tt_ql_cl 。 actors = so…
为什么要进行Python ElementTree& BS4库在这里失败了吗?
我使用BS4和ElementTree从简单的XML文件中提取数据有问题。从错误消息中,问题可以在XML文件中或代码中。 XML文档: B S4尝试: from bs4 import Beau…
如何防止美丽的小组向纯文本添加HTML标签
在我的应用程序中,我正在使用BeautifulSoup来处理所有电子邮件模板。 其中一些是完整的HTML文档,但其中一些只是纯文本(主要用于测试)。 正如问题…
美丽的汤。需要从在线报告中刮擦桌子
我想用美丽的汤来刮擦以下数据。我可以找到。请帮忙。 SUMMARY Alberta Total Net Generation9299 Net Actual Interchange-386 Alberta Internal Load…
BeautifulSoup -typeError:'模块'对象不可呼应
谁能向我解释为什么我会收到此错误消息?我在另一个项目中具有完全相同的代码,但是在创建新的VENV并安装请求后,BS4和HTML.Parser 我收到了此消息。…
如何使用Beautifulsoup通过班级名称找到父元素?
如何使用BeautifulSoup正确访问标签的父元素?我有以下结构: Character Information 网站上有 n 结构,为了获取正确的信息,我首先要通过文本“字符…
为什么要打印一个空列表和词典?
import requests from bs4 import BeautifulSoup import json data = { 0:{ 0:"title", 1:"dates", 2:"city/state", 3:"country" }, 1:{ 0:"event", 1…
如何处理ASCII'编解码器可以编码字符' \ xe9'错误?
我正在尝试从网站下载Excel文件。下面我的代码: import os import requests from bs4 import BeautifulSoup # Python 3.x from urllib.request impor…