beautifulsoup

beautifulsoup

文章 107 浏览 123

在 re.compile 中使用变量

for issn in inputList: link = journalresults.find('a', attrs={'href' : re.compile(issn + '$')}) 我试图将变量“issn”与 re.compile 一起使用…

我乃一代侩神 2024-12-12 04:30:33 0 0

使用Python / urllib / beautifulsoup从URL批量下载文本和图像?

我已经浏览了这里的几篇文章,但我就是无法理解使用 Python 从给定 URL 批量下载图像和文本。 import urllib,urllib2 import urlparse from Beautiful…

梦归所梦 2024-12-12 03:44:12 0 0

Python 网页抓取;美丽的汤

这篇文章对此进行了介绍:Python Web 抓取涉及带有属性的 HTML 标签 但我无法对此网页执行类似的操作: http://www.expatistan.com/cost-of-living/co…

べ映画 2024-12-11 20:55:00 0 0

从 Python 代码将字符串插入 SQLite 数据库时出错

当我想将 Python 代码中的字符串插入 SQLite 数据库时,出现以下错误: sqlite3.ProgrammingError: 不得使用 8 位字节串,除非 您使用可以解释 8 位字…

撕心裂肺的伤痛 2024-12-11 17:43:25 1 0

如何将 BeautifulSoup.ResultSet 转换为字符串

因此,我使用 .findAll (BeautifulSoup) 将 html 页面解析为名为 result 的变量。 如果我在 Python shell 中输入 result 然后按 Enter,我会看到预期…

阳光的暖冬 2024-12-10 03:52:59 1 0

从 url pip 安装包

pip install http://www.crummy.com/software/BeautifulSoup/unreleased/4.x/BeautifulSoup-4.0b.tar.gz 这将安装 bs4 软件包,一切正常。但是,如果…

奈何桥上唱咆哮 2024-12-09 17:59:17 2 0

使用 Python 和 Beautiful Soup 从 API XML feed 解析/提取数据

Python/xml 新手在这里使用 Python 和 BeautifulSoup 尝试学习如何解析 XML,特别是使用 Ooodle.com API 来列出汽车分类。我在简单的 XML 和 BS 方面…

洛阳烟雨空心柳 2024-12-09 10:43:30 1 0

如何使用BeautifulSoup识别各个网站的菜单?

我想识别网站中具有主菜单的div元素。 我正在考虑的方法: 使用 Beautiful Soup Menus 解析 HTML 通常具有最高的链接 密度即锚标记计数或查找带有所有…

清风夜微凉 2024-12-09 06:21:31 0 0

查找带有 beautifulsoup 的特定链接

嗨,我无法弄清楚如何找到以某些文本开头的链接。 findall('a') 工作正常,但太多了。我只想列出以以下内容开头的所有链接 http://www.nhl.com/ice/bo…

纵山崖 2024-12-09 02:40:59 0 0

父类中的 __getattr__ 导致子类 __init__ 递归错误

按照答案中的建议:子类化 beautifulsoup html 解析器,出现类型错误,我尝试使用类组合而不是子类化BeautifulSoup。 基本的 Scraper 类本身就可以很…

中性美 2024-12-08 18:41:54 0 0

使用 beautifulSoup 抓取网页的 Python 脚本

我正在尝试使用 BeautifulSoup 抓取以下页面的内容, info - 1 Other info-2, info-3, info-4, info-5 info-6 info - 7 info - 8 test info - 8 该页…

锦上情书 2024-12-08 10:44:03 0 0

子类化 beautifulsoup html 解析器,出现类型错误

我最近使用 beautifulsoup 很棒的 html 解析器编写了一个小包装器, 最近我尝试改进代码并使所有 beautifulsoup 方法直接在包装器类中可用(而不是通…

思念绕指尖 2024-12-08 09:48:27 0 0

Python 屏幕抓取整个网站

我想制作一个小程序,它将使用任何网站上的每一个具有某种意义的单词 它应该是用Python编写的,我听说过BeautifulSoup,但我不太知道如何使用它来达到…

一张白纸 2024-12-07 14:39:16 0 0

为什么我会收到“IndexError:列表索引超出范围”? (美丽的汤)

我正在尝试此处抓取结构非常相似的表格到 我以前的问题。我刚刚更改了属性名称,但收到 index out of range 错误。这是 TR: 1 Wachtell, Lipton 1 9.…

百善笑为先 2024-12-07 14:32:51 0 0

从 html 文件中提取文本?

我有一个网页,其中包含一堆文本,我想从页面中提取文本并将其写入文件。我正在尝试使用 BeautifulSoup,但不确定它是否能轻松实现我想要的功能。故事…

温暖的光 2024-12-07 13:40:40 0 0
更多

推荐作者

已经忘了多久

文章 0 评论 0

15867725375

文章 0 评论 0

LonelySnow

文章 0 评论 0

走过海棠暮

文章 0 评论 0

轻许诺言

文章 0 评论 0

信馬由缰

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文