beautifulsoup

beautifulsoup

文章 107 浏览 123

从 Twitter XML 页面提取数据的列表问题

通过我的函数,我可以从 Twitter xml 搜索页面中提取我正在作为项目构建的朋友查找应用程序的用户名。但问题是,当我抓取用户名并将它们输入到列表中…

对你而言 2024-11-25 02:58:50 1 0

如何使用 BeautifulSoup 解析包含非 ASCII 字符的 HTML?

当尝试使用 BeautifulSoup 解析某些 html 时,我不断收到以下错误: UnicodeDecodeError: 'ascii' codec can't decode byte 0xae in position 0: ordi…

甚是思念 2024-11-24 07:04:59 0 0

帮助提取此内容+美丽的汤

我正在尝试从这种格式的网站中提取数据 ..... extra stuff **Main Content** 请注意,MainContent 可以包含其他标签,但我想要像字符串这样的整个内容…

生死何惧 2024-11-24 02:50:15 0 0

Python 查找与查找替换美汤

我正在使用 Beautiful Soup 用 HTML 文件中的 href 链接替换出现的模式 我遇到了如下所述的问题 modified_contents = re.sub("([^http://*/s]APP[a-z]…

素手挽清风 2024-11-19 21:53:28 2 0

使用 Python 从 HTML 到 CSS 样式

我已经使用 beautifulsoup 从 HTML 页面中提取了某些元素,并希望通过 python 提取相应的 CSS 样式(大多数情况下驻留在外部 css 文件中)。 如果我有…

忘羡 2024-11-19 14:55:49 0 0

用Python爬虫?

我想用python写一个爬虫。这意味着:我已经获得了一些网站主页的网址,并且我希望我的程序能够通过保留在该网站中的链接来爬行所有网站。我怎样才能轻…

风渺 2024-11-19 10:24:29 2 0

使用 urllib2 避免 503 错误

我是用 python 进行网络抓取的新手,所以我不知道我这样做是否正确。 我正在使用一个调用 BeautifulSoup 的脚本来解析 google 搜索的前 10 页中的 URL…

少跟Wǒ拽 2024-11-19 03:33:07 2 0

如何使用 lxml 处理嵌套表单标签

我想抓取一些带有 lxml 嵌套表单元素的 html 页面。即使 BeautifulSoup 在这些页面上也会卡住,到目前为止我发现唯一可以处理它们的解析器是 MinimalS…

当爱已成负担 2024-11-19 01:40:24 0 0

是否有一个 python 模块可以在网络上抓取图像、标题和任何链接的描述?

我正在寻找什么,应该给我这样的东西 -> …

百思不得你姐 2024-11-19 00:18:22 1 0

URL解析错误[BeautifulSoup]

我正在尝试从网站页面获取 href 链接列表;但是我的代码无法正常工作。该代码在不应附加到 urlList 时被附加。它还复制了 href 链接。 import urllib2…

千秋岁 2024-11-18 09:04:47 0 0

带有可选标签的 Python BeautifulSoup

让我举一个例子: from BeautifulSoup import BeautifulStoneSoup root = ''' Picture www.thing.com Another one! ''' soup = BeautifulStoneSoup(ro…

拥抱影子 2024-11-18 08:26:11 0 0

Python CSV 将每个字母放入新字段的问题

我正在尝试将 URL 列表放入一个 csv 文件中,该文件是我使用 urllib2 和 BeautifulSoup 从网页中抓取的。我尝试将 csv 文件的链接写入为 unicode 并转…

影子是时光的心 2024-11-18 06:17:44 1 0

帮助解析
 之间使用 BeautifulSoup 的标签 

我尝试使用 BeautifulSoup 和 python 解析网站上的信息。该 html 如下所示。我希望我的解析数据看起来像: ID 定义 赖氨酸生物合成 - 假鼻伯克霍尔德…

撞了怀 2024-11-18 02:32:22 0 0

使用 Python 和 Beautiful Soup 解析 HTML

Member SinceJanuary 2010 AIGA ChapterAlaska TitleOwner CompanyMad Dog Graphx 我正在使用 Beautiful Soup 在 HTML 代码中达到这一点。我现在想要…

○闲身 2024-11-18 01:54:48 2 0

Python-是否有一个模块可以自动从网页上抓取文章内容?

我知道有 lxml 和 BeautifulSoup,但这对我的项目不起作用,因为我事先不知道我试图从中抓取文章的网站的 HTML 格式是什么。是否有一个类似于 Readabi…

我爱人 2024-11-17 21:49:19 0 0
更多

推荐作者

已经忘了多久

文章 0 评论 0

15867725375

文章 0 评论 0

LonelySnow

文章 0 评论 0

走过海棠暮

文章 0 评论 0

轻许诺言

文章 0 评论 0

信馬由缰

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文