lxml

lxml

文章 28 浏览 87

Python,XPath:查找所有图像链接

我在 Python 中使用 lxml 来解析一些 HTML,我想提取所有图像链接。我现在的做法是: //a[contains(@href,'.jpg') or contains(@href,'.jpeg') or ...…

蓝戈者 2024-10-05 07:09:00 5 0

在 Python 中从 amara 切换到 lxml

我正在尝试使用 lxml 库完成这样的事情: http://www.xml.com/pub/a/2005 /01/19/amara.html from amara import binderytools container = binderytoo…

挖鼻大婶 2024-10-04 05:42:27 7 0

Python、BeautifulSoup 或 LXML - 使用 CSS 标签从 HTML 解析图像 URL

我四处寻找有关 BeautifulSoup 或 LXML 如何工作的合理解释。诚然,他们的文档很棒,但对于像我这样的 python/编程新手来说,很难破译我正在寻找的内…

鹿港小镇 2024-10-04 04:24:22 4 0

lxml etree xmlparser 删除不需要的命名空间

我有一个 xml 文档,我试图使用 Etree.lxml 解析它, 1 some stuff 我的代码是: path = "path to xml file" from lxml import etree as ET parser = …

如日中天 2024-10-03 18:41:40 7 0

我如何使用 xpath 和 lxml 从以下可怕的 html 中选择这些元素?

我想仅使用 lxml 和一些聪明的 xpath 从此 html 中选择以下字符串。字符串会改变,但周围的 html 不会改变。 我需要... 19/11/2010 AAAAAA/01 正常 英…

暗地喜欢 2024-10-03 13:40:19 2 0

Python在cssselect和text_content()之后在lxml.html中保留换行符

在python中,使用lxml.html时如何保留段落(即保留换行符)? 例如,以下内容将剥离 标签并加入行,这不是我想要的: body = doc.cssselect("div.body…

孤千羽 2024-10-03 07:58:48 3 0

如何在 lxml 中将 xml 命名空间与 find/findall 一起使用?

我正在尝试解析 OpenOffice ODS 电子表格中的内容。 ods 格式本质上只是一个包含许多文档的 zip 文件。电子表格的内容存储在“content.xml”中。 impo…

国际总奸 2024-10-03 05:43:12 6 0

lxml 在 Solaris 10 上构建

请您就 python 2.6.6 和 lxml Solaris 10 构建问题提供帮助和建议吗? 安装说明: www.sunfreeware.com/download.html 文件直接链接: http://www .su…

唯憾梦倾城 2024-10-03 01:56:59 3 0

使用 lxml 提取所有元素事先未知的数据

我有一些大致标准化的 sgml 文件。但是,在打开文件并亲自阅读之前,标签中可能包含我不知道其存在的数据。例如,文件具有地址,并且通常地址具有街道…

千纸鹤带着心事 2024-10-03 01:45:46 6 0

如何使用 lxml 、 python 解析 html

我有一些 html 文件: Onesome text1 Мирsome text2 如何使用 lxml 和 python 获取“some text1”和“some text2”?…

回忆追雨的时光 2024-10-02 14:48:54 4 0

使用 python/django 安装 lxml 时出现问题

我正在尝试在 django 的一个项目中使用 lxml,但安装 lxml 模块时遇到问题。我使用的是 Ubuntu 10.04。我在网上查找了有关如何安装 lxml 模块的合适教…

风情万种。 2024-10-02 13:47:00 2 0

lxml.html 搜索和替换

不管怎样,我需要你的帮助或建议。 我开始阅读一些关于Python的书籍只是因为我有这个问题:)但是我发现我需要很长时间才能学习整个语言。我还浏览并搜…

谁的年少不轻狂 2024-10-01 08:06:20 4 0

如何使用 xpath & 获取节点的完整内容lxml?

我正在使用 lxml 的 xpath 函数来检索网页的部分内容。我正在尝试获取 标记的内容,其中包括其自己的 html 标记。如果我使用, //td[@valign="top"]/p…

绿光 2024-10-01 07:42:38 3 0

如何重写这个函数来实现 OrderedDict?

我有以下函数,它完成了将 XML 文件解析为字典的粗略工作。 不幸的是,由于 Python 字典没有排序,我无法按照我的意愿循环浏览节点。 如何更改它,以…

怪我鬧 2024-10-01 01:08:44 6 0

lxml 无法解析?

我想解析html中的表格,但我发现lxml无法解析它?怎么了? # -*- coding: utf8 -*- import urllib import lxml.etree keyword = 'lxml+tutorial' url …

长发绾君心 2024-09-30 21:56:44 5 0
更多

推荐作者

巷子口的你

文章 0 评论 0

微信用户

文章 0 评论 0

神妖

文章 0 评论 0

7460852697

文章 0 评论 0

ligengkai

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文