beautifulsoup

beautifulsoup

文章 107 浏览 121

“ascii” beautifulsoup 中的编解码器错误

我正在使用 beautifulsoup 从 html 页面抓取数据。直到昨天一切都很好。但是现在我收到错误: 'ascii' codec can't encode character u'\xa9' in posi…

兔小萌 2024-10-02 23:52:51 0 0

如何使用美丽的汤解析表内表?

我试过这个: s = soup.findAll("table", {"class": "view"}) 但它给了我桌子。但我需要表内表。 &lttable class="view" &gt &lttr&gt &lttd width="4…

撩人痒 2024-10-02 11:15:24 0 0

我无法使用 Beautiful Soup 进行解析

&lttd&gt &lta name="corner"&gt&lt/a&gt &ltdiv&gt &ltdiv style="aaaaa"&gt &ltdiv class="class-a"&gtMy name is alis&lt/div&gt &lt/div&gt &ltdi…

孤独岁月 2024-10-02 09:59:33 0 0

BeautifulSoup 对 jQuery 脚本感到窒息,有什么已知的解决方法吗?

我给 BeautifulSoup 一个 html 文档,只需用完整的 html 构造一个 BeautifulSoup 对象实例,它似乎就会被嵌入 html 中的 jQuery 脚本的以下行阻塞: v…

冷︶言冷语的世界 2024-10-02 05:29:47 0 0

贪婪执行语句?

我使用 BeautifulSoup 有类似的东西: for line in lines: code = l.find('span', {'class':'boldHeader'}).text coded = l.find('div', {'class':'De…

夏末染殇 2024-09-30 18:38:49 1 0

如何使用 BeautifulSoup 从网页上的某些 JavaScript 中提取长字符串文本?

我正在尝试编写一个脚本,以便可以登录网站,但为了做到这一点,我需要提供验证码。从 URL 获取验证码直接图像的唯一方法是提取巨大的字符串名称“cha…

月下凄凉 2024-09-30 14:03:49 2 0

Python - BeautifulSoup html解析处理gbk编码不佳 - 中文网页抓取问题

我一直在修改以下脚本: # -*- coding: utf8 -*- import codecs from BeautifulSoup import BeautifulSoup, NavigableString, UnicodeDammit import u…

洛阳烟雨空心柳 2024-09-30 09:30:53 1 0

Beautiful Soup - 在文档的两个部分之间搜索

是否可以仅对页面上两个字符串之间包含的内容运行 Beautiful Soup? 在多次遇到使用 Yahoo Pipes 进行屏幕抓取的限制后,我开始使用 Beautiful Soup,…

°如果伤别离去 2024-09-30 07:54:07 0 0

如何处理utf-8编码的String和BeautifulSoup?

如何用正确的 unicode 替换 unicode 字符串中的 HTML 实体? u'&ampquotHAUS Kleider&ampquot - &ampUumlber das Bekleiden und Entkleiden, das Verh…

浮世清欢 2024-09-29 09:19:47 2 0

使用SoupStrainer选择性解析

我正在尝试解析购物网站上的视频游戏标题列表。然而,由于项目列表全部存储在标签内。 这个&lt文档的 /a&gt 部分据说解释了如何仅解析文档的一部分,…

有深☉意 2024-09-29 02:49:08 3 0

提取所有

Beautiful Soup findAll() 对 findall() 的结果返回 TypeError

嗨,我是 Python 和 Beautiful soup 的新手。我试图仅从表格的特定部分获取文本。但 findAll 的结果似乎不是我可以再次运行 findAll 的 BeautifulSoup…

猫瑾少女 2024-09-27 15:24:08 1 0

用 BeautifulSoup 替换 html 标签

我目前正在使用 BeautifulSoup 重新格式化一些 HTML 页面,但遇到了一些问题。 我的问题是原始 HTML 有这样的内容: &ltli&gt&ltp&gtstff&lt/p&gt&lt/…

失而复得 2024-09-26 23:27:06 0 0

解析html美丽汤

我有一个 html 页面, &lta email="[email&nbspprotected]" href="http://www.max.ru/agent?message&amp[email&nbspprotected]" title="Click herе" …

谢绝鈎搭 2024-09-26 07:40:29 1 0

更多

推荐作者

lioqio

文章 0 评论 0

Single

文章 0 评论 0

禾厶谷欠

文章 0 评论 0

alipaysp_2zg8elfGgC

文章 0 评论 0

qq_N6d4X7

文章 0 评论 0

放低过去

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文