beautifulsoup

beautifulsoup

文章 107 浏览 123

从 html 文件中提取文本?

我有一个网页,其中包含一堆文本,我想从页面中提取文本并将其写入文件。我正在尝试使用 BeautifulSoup,但不确定它是否能轻松实现我想要的功能。故事…

温暖的光 2024-12-07 13:40:40 1 0

BeautifulSoup:属性错误:'NavigableString'对象没有属性“名称”;

你知道为什么 BeautifulSoup 教程中的第一个例子 http://www.crummy.com /software/BeautifulSoup/documentation.html#QuickStart 给出 AttributeErro…

任谁 2024-12-06 19:34:54 0 0

BeautifulStoneSoup - 如何取消转义并添加结束标签

我正在此处编辑原始帖子以进行澄清,并希望我已将其简化为更易于管理的内容。我有一个 xml 字符串,看起来像: <img alt="jules.png" src="http://…

掩于岁月 2024-12-06 15:29:45 0 0

使用 beautiful soup 基于类和 href 标签解析 html 标签

我正在尝试使用 BeautifulSoup 解析 HTML。 我想要的内容是这样的: Title 我尝试并得到以下错误: maxx = soup.findAll("href", {"class: "yil-biz-t…

复古式 2024-12-06 07:34:59 1 0

美丽的汤线搭配

我正在尝试构建一个仅包含表头和与我相关的行的 html 表。我正在使用的网站是 http://wolk.vlan77.be/~gerben。 我正在尝试获取表头和表条目,这样我…

夕嗳→ 2024-12-06 04:39:53 1 0

Beautiful Soup - 如何修复损坏的标签

我想知道如何在使用 Beautiful Soup 解析之前修复损坏的 html 标签。 在以下脚本中,td> 需要替换为 。 我怎样才能进行替换以便 Beautiful Soup 可以…

看透却不说透 2024-12-06 03:53:01 0 0

Beautiful Soup - 如何解析表的列并将它们插入到两个列表中

我正在尝试解析一个包含两列的表,并将每列中的文本插入到两个列表中。 我需要一些想法如何去做。 from BeautifulSoup import BeautifulSoup s = """T…

等风也等你 2024-12-06 03:25:25 0 0

美丽的汤 - 处理错误

我想知道如何处理 Text: 之后不存在 href 的情况 Is there搜索内容的更好方法Contact: 之后存在的 http://pastebin.com/FYMxTJkf…

上课铃就是安魂曲 2024-12-04 20:12:32 0 0

BeautifulSoup python 解析html文件

我正在使用 BeautifulSoup 将 html 文件中的所有逗号替换为 ‚。这是我的代码: f = open(sys.argv[1],"r") data = f.read() soup = BeautifulSo…

穿透光 2024-12-04 08:53:56 0 0

美丽的汤 - 如何获取 href

我似乎无法从以下 html 汤中提取 href(页面上只有一个 Website:): Website: www.google.com 这就是我的思想应该有效 href = soup.find("strong" ,t…

好菇凉咱不稀罕他 2024-12-04 07:01:20 0 0

行为怪异的美丽汤字符串方法

我正在尝试在此页面中获取图像 - http://www.bkstr.com/webapp/wcs/stores/servlet/CourseMaterialsResultsView?catalogId=10001&categoryId=9604&sto…

生生不灭 2024-12-04 06:46:25 0 0

Python BeautifulSoup 编码

我有一个代码可以使用 Beautiful Soup 读取 html 并修改一些文本。它工作正常,但是当我读取输出时,我的 html 文件的这一部分会自动更改: Original …

二手情话 2024-12-04 03:02:53 0 0

美丽的汤和桌子

你好,我正在尝试使用 Beautiful Soup 解析 html 表。 该表看起来像这样: Home ABXBarrick Gold Corp.55.9555.18+0.701104060170.28%  Q&n…

放低过去 2024-12-03 19:41:58 0 0

在 Python 中运行基本 Web Scrape 时出现索引错误

我正在使用Python 2.7。当我尝试运行此代码时,当函数命中 print findPatTitle[i] 时出现问题,并且 python 返回“索引错误:列表索引超出范围”。我…

初相遇 2024-12-03 05:43:41 0 0

在此 Python 脚本中将 BeautifulSoup 替换为另一个(标准)HTML 解析模块

我用 BeautifulSoup 制作了一个脚本,它运行良好并且非常可读,但我想有一天重新分发它,而 BeautifulSoup 是我想避免的外部依赖项,特别是考虑到 Win…

情绪失控 2024-12-02 23:54:32 0 0
更多

推荐作者

已经忘了多久

文章 0 评论 0

15867725375

文章 0 评论 0

LonelySnow

文章 0 评论 0

走过海棠暮

文章 0 评论 0

轻许诺言

文章 0 评论 0

信馬由缰

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文