beautifulsoup

beautifulsoup

文章 107 浏览 127

如何防止美丽的小组编码逃脱的角色

正如该问题中提到的那样 - 我希望Beautifulsoup将原始角色保留在HTML中,而不是更换它们。简单示例: soup1 = BeautifulSoup( "APOLLOE4: Early Alzhe…

梦里兽 2025-02-08 11:18:30 3 0

我只能从#0-9和az'中选择链接。在美丽的小组?

我的URL是这个 https:> https:// https: /在选择从A到Z的所有链接时。 link = s.get(url) link_soup = BeautifulSoup(link.text, 'lxml') links = …

寄离 2025-02-08 10:44:27 1 0

如何在每个元素中迭代?

import requests from bs4 import BeautifulSoup url = "https://bigpara.hurriyet.com.tr/borsa/hisse-fiyatlari/" r = requests.get(url) soup = Be…

笑梦风尘 2025-02-08 10:21:21 1 0

网络刮擦标题,设法刮擦链接,但很难使用文件名

如何为每个链接刮擦文件的所有名称?我设法刮擦链接,但似乎无法刮擦文件的名称。对于更多的上下文,我使用了Beautifulsoup并找到所有链接。…

霓裳挽歌倾城醉 2025-02-08 07:44:21 2 0

用美丽的小组编写的简单代码不起作用

我试图学习美丽的汤。我在视觉代码中运行以下代码。但是没有成功的答案。终端没有显示错误。 from bs4 import BeautifulSoup import requests url = "…

冧九 2025-02-08 07:36:19 1 0

需要帮助正确地提取信息

from bs4 import BeautifulSoup import requests from datetime import datetime from dateutil.relativedelta import relativedelta evr_begin = dat…

很酷不放纵 2025-02-08 06:17:15 1 0

硒和美丽的小组更改html元素内的数字

我想提取每个团队从网站获得的黄牌数量 这是我的代码 driver = webdriver.Chrome(service=chrome_driver_path) driver.get("https://www.premierleagu…

为人所爱 2025-02-08 01:19:33 2 0

如何使用Beautifulsoup在IMDB的演出中提取演员?

我正在尝试使用BeautifulSoup提取办公室的演员列表来刮擦此IMDB页 https://www.imdb.com/title/tt0386676/fullcredits/?ref_=tt_ql_cl 。 actors = so…

岁月静好 2025-02-07 23:26:25 2 0

为什么要进行Python ElementTree& BS4库在这里失败了吗?

我使用BS4和ElementTree从简单的XML文件中提取数据有问题。从错误消息中,问题可以在XML文件中或代码中。 XML文档: B S4尝试: from bs4 import Beau…

风尘浪孓 2025-02-07 23:22:14 2 0

如何防止美丽的小组向纯文本添加HTML标签

在我的应用程序中,我正在使用BeautifulSoup来处理所有电子邮件模板。 其中一些是完整的HTML文档,但其中一些只是纯文本(主要用于测试)。 正如问题…

素罗衫 2025-02-07 22:55:02 2 0

美丽的汤。需要从在线报告中刮擦桌子

我想用美丽的汤来刮擦以下数据。我可以找到。请帮忙。 SUMMARY Alberta Total Net Generation9299 Net Actual Interchange-386 Alberta Internal Load…

小嗲 2025-02-07 22:18:42 2 0

BeautifulSoup -typeError:'模块'对象不可呼应

谁能向我解释为什么我会收到此错误消息?我在另一个项目中具有完全相同的代码,但是在创建新的VENV并安装请求后,BS4和HTML.Parser 我收到了此消息。…

仙女 2025-02-07 21:31:15 1 0

如何使用Beautifulsoup通过班级名称找到父元素?

如何使用BeautifulSoup正确访问标签的父元素?我有以下结构: Character Information 网站上有 n 结构,为了获取正确的信息,我首先要通过文本“字符…

帝王念 2025-02-07 19:46:27 1 0

为什么要打印一个空列表和词典?

import requests from bs4 import BeautifulSoup import json data = { 0:{ 0:"title", 1:"dates", 2:"city/state", 3:"country" }, 1:{ 0:"event", 1…

野稚 2025-02-07 19:26:01 1 0

如何处理ASCII'编解码器可以编码字符' \ xe9'错误?

我正在尝试从网站下载Excel文件。下面我的代码: import os import requests from bs4 import BeautifulSoup # Python 3.x from urllib.request impor…

年少掌心 2025-02-07 19:10:39 2 0
更多

推荐作者

qq_VRzBBA45

文章 0 评论 0

痴情

文章 0 评论 0

文章 0 评论 0

Mu.

文章 0 评论 0

凉薄对峙

文章 0 评论 0

不落城

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文