第 7 页 - beautifulsoup

beautifulsoup

文章 107 浏览 123

使用 BeautifulSoup 获取与扩展名匹配的文件名

我正在尝试使用 BeautifulSoup 解析 HTML 页面，该页面包含文本文件，以 .txt 扩展名结尾。我想解析 HTML，并获取以 .txt 结尾的字符串。所有此类字…

花开浅夏 2024-11-10 14:12:04 0 0

在 django 中同步新的 BeautifulSoup 包时出现问题

这是回溯，请帮忙。 Traceback (most recent call last): File "C:\Documents and Settings\EC.32-SAMUEL\workspace\ec\ec\manage.py", line 11, in e…

佼人 2024-11-09 06:44:22 2 0

BeautifulSoup 无法提取元数据

我正在尝试创建一个函数，该函数将从给定的 URL 中提取元关键字并返回它。然而，无论我传递给它什么 URL，它总是会失败。 def GetKeywords(url): soup…

oО清风挽发oО 2024-11-09 03:39:47 3 0

从非唯一表上的 html 检索字符串

这是我试图解析的 html。 Serial NumberAB12345678 我正在尝试使用正则表达式来解析数据。我听说过 BeautifulSoup，但页面上有大约 50 个类似的项目，…

装纯掩盖桑 2024-11-08 03:11:01 3 0

为什么 Beautiful Soup 无法显示所有表中的数据？

一周前我尝试抓取维基百科页面。但我无法弄清楚为什么 Beautiful Soup 只会显示表列中的一些字符串，而其他表列则显示“无”。注意：表列均包含数据…

就像说晚安 2024-11-08 02:49:13 0 0

Python href 并保存到 .txt（不用担心，不是另一个正则表达式问题）

我目前正在创建一个 python 脚本，允许用户输入 torrent 的哈希值（通过终端），并通过网站检查更多跟踪器。然而，我很茫然，希望能得到一些建议，因…

苦行僧 2024-11-07 16:06:10 1 0

使用 BeautifulSoup 提取标签内的内容

我想提取内容Hello world。请注意，页面上还有多个和类似的： Name: Hello world ... 我尝试了以下操作： hello = soup.find(text='Name: ') hello.…

花开半夏魅人心 2024-11-07 12:07:19 2 0

美丽汤 - nextSibling

我尝试使用以下内容获取内容“我的家庭地址”，但收到 AttributeError: address = soup.find(text="Address:") print address.nextSibling This is my…

留蓝 2024-11-07 08:17:34 0 0

BeautifulSoup：使用字符串获取值

是否可以使用字符串来获取标签的值？ XML 结构： book title titletext book title titletext 代码： books = BeautifulStoneSoup().findAll('book') …

潦草背影 2024-11-07 06:36:43 1 0

BeautifulSoup 打印多个标签/属性

首先，这是我第一次尝试 Python，到目前为止它看起来很容易使用，尽管我仍然遇到了问题.. 我正在尝试将 XML 文件更改为 rss-XML 原始的 xml 源看起来…

盗梦空间 2024-11-07 05:58:55 3 0

如何在 beautifulsoup 中打开带有 windows-1252 编码的 HTML 页面

我尝试用 beautifulsoup 解析 HTML 文档，但遇到了麻烦。打开使用 windows-1252 编码的 HTML 文档的最佳方法是什么？我尝试使用 iconv 转换为 utf-8 …

缱倦旧时光 2024-11-07 03:23:54 0 0

删除
来自已解析的 Beautiful Soup 列表的标签？

我目前正在进入一个 for 循环，其中包含我想要的所有行： page = urllib2.urlopen(pageurl) soup = BeautifulSoup(page) tables = soup.find("td", "b…

最初的梦 2024-11-06 05:21:37 3 0

Beautifulsoup 和 AJAX 表问题

我正在制作一个脚本，用于抓取国际星际争霸 2 游戏的 Team Liquid 数据库中的游戏。（http://www.teamliquid.net/tlpd/sc2-international/games）但…

╰沐子 2024-11-06 04:07:05 2 0

Python BeautifulSoup 的编码错误 +数据库

我正在使用 BeautifulSoup python 库。我使用 urllib2 库从页面下载 HTML 代码，然后使用 BeautifulSoup 对其进行解析。我想将一些 HTML 内容保存到…

雪花飘飘的天空 2024-11-05 05:08:58 3 0

访问 BeautifulSoup 中的属性时出现问题

我在使用 Python (2.7) 时遇到问题。代码基本上包括： str = 'ABCDEF' z = BeautifulStoneSoup(str) for x in z.findAll('el'): # if 'at' in x: # if…

迟到的我 2024-11-04 17:48:24 4 0

共 30 页
上一页
5
6
7
8
9
下一页

友情链接

文江博客