beautifulsoup

beautifulsoup

文章 107 浏览 123

是否可以用美丽的汤来提取多种类型的物品?

我一直在查看文档,但他们没有涵盖这个问题。我正在尝试提取所有文本和所有链接,但不是单独提取。我希望它们交错以保留上下文。我想最终得到一个文本…

酒与心事 2024-11-17 16:08:12 0 0

Scrapy 解析错误的 br 标签问题

我有一个 html 文件,其网址以 br 标签分隔,例如 Site1 Site2 Site3 请注意换行符标签是 而不是 。 Scrapy 能够解析并提取第一个 url,但无法提取此…

云仙小弟 2024-11-17 04:49:25 2 0

提取元素并插入空格

我在 python 中使用 BeautifulSoup 解析 html 我不知道如何在提取文本元素时插入空格 这是代码: import BeautifulSoup soup=BeautifulSoup.Beautiful…

魂ガ小子 2024-11-17 03:41:53 1 0

如何翻译/转换 unicode escaped<和>在阅读 HTML 文档中?

当我使用 urllib2 opener 在 python 中读取一些(但不是全部)HTML 文件时,在某些文件上,我得到的文本充满了大量反斜杠和 unicode 003c 字符串。我…

权谋诡计 2024-11-17 01:36:51 0 0

美丽汤并找到

我有一个 html 代码: 如何在 ID 为 div1 的 div 中获取所有内容? soup.find('div',{'id':"div1"}) 返回: 我只需要获取: …

铁轨上的流浪者 2024-11-16 21:29:50 0 0

使用 Python 和 BeautifulSoup 解析表

我正在尝试使用 Python 和 BeautifulSoup 访问某些 td 标签中的内容。我可以获取第一个符合条件的 td 标签(使用 find),也可以获取所有符合条件的 t…

话少情深 2024-11-16 12:25:19 0 0

在Python中使用BeautifulSoup解析html

我写了一些代码来解析html,但结果不是我想要的: import urllib2 html = urllib2.urlopen('http://dummy').read() from BeautifulSoup import Beauti…

情何以堪。 2024-11-16 10:36:32 0 0

BeautifulSoup -- 防止标签自动关闭

BeautifulSoup 在解析以下代码时感到窒息: >>> soup = BeautifulSoup('" border="0" />') >>> soup.prettify() '\n" border="0" />\n' 我还应该注意…

呆° 2024-11-16 01:12:47 0 0

beautifulsoup 中的 renderContents (python)

我试图工作的代码是: h = str(heading) # 'Heading' heading.renderContents() 我收到此错误: Traceback (most recent call last): File "", line 1…

℡Ms空城旧梦 2024-11-15 05:14:30 0 0

Python - 将多个 HTML 页面解析为单个 TXT 文件

我正在尝试将 X 个 HTML 文件中的特定内容解析为单个 TXT 文件。 我已经肮脏地编码了以下内容: #!/usr/bin/python import sys, mechanize, Beautiful…

淤浪 2024-11-15 00:48:51 0 0

Python 漂亮的 Soup 代码不起作用

我正在 Linux 中尝试这段代码,它给出了空输出。 我刚刚复制并粘贴了 BS 文档 import urllib2 from BeautifulSoup import BeautifulSoup soup = Beaut…

手心的海 2024-11-14 11:24:29 1 0

根据标签周围的内容查找标签(使用 beautifulsoup)

我正在使用 BeautifulSoup 来解析一些 HTML。假设我在一个名为 soup 的 BeautifulSoup 中有以下 HTML: test1 test2 test3 test4 test4 我可以使用以…

白龙吟 2024-11-14 06:46:22 1 0

是否可以在 beautiful Soup 中编写搜索引擎代码

我正在使用 Beautiful Soup 来解析网页。 BS 中是否有任何我可以使用的功能来制作搜索引擎或抓取网站以将其索引到数据库中。…

所有深爱都是秘密 2024-11-14 00:15:18 1 0

使用 BeautifulSoup 在 python 中提取链接标签之间的文本

我有这样的 html 代码: 我的主页 部分 我需要提取“a”标签之间的文本(链接描述)。我需要一个数组来存储这些内容,例如: a[0] = "My HomePage" a[…

分开我的手 2024-11-13 07:38:31 1 0

在Python中快速解析页面外的链接

我需要解析大量页面(比如 1000 个)并将链接替换为tinyurl 链接。 现在我正在使用正则表达式执行此操作 href_link_re = re.compile(r"]+?href\s*=\s*…

浮云落日 2024-11-11 15:37:44 0 0
更多

推荐作者

胡图图

文章 0 评论 0

zt006

文章 0 评论 0

z祗昰~

文章 0 评论 0

冰葑

文章 0 评论 0

野の

文章 0 评论 0

天空

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文