lxml

lxml

文章 28 浏览 87

从 lxml.objectify.ObjectifiedElement 中剥离 python 命名空间属性

可能的重复: 使用 lxml 时,是否可以在不使用 lxml 的情况下渲染 XML命名空间属性? 如何从 lxml.objectify.ObjectifiedElement 中剥离 python 属性…

无法言说的痛 2024-11-10 02:00:52 4 0

Python lxml/beautiful soup 查找网页上的所有链接

我正在编写一个脚本来读取网页,并构建符合特定条件的链接数据库。现在我陷入了 lxml 并理解如何从 html 中获取所有 's ... result = self._openurl(s…

燕归巢 2024-11-10 01:30:21 1 0

在 lxml 中迭代时就地编辑树

我正在使用 lxml 来解析 html 并编辑它以生成一个新文档。本质上,我尝试像 javascript DOM 一样使用它 - 我知道这并不是真正的预期用途,但到目前为…

优雅的叶子 2024-11-09 22:50:42 1 0

相当于使用lxml.html解析HTML时的InnerHTML

我正在编写一个使用 lxml.html 解析网页的脚本。我曾经做过相当多的 BeautifulSoup,但由于 lxml 的速度,我现在正在尝试它。 我想知道库中最明智的方…

溺ぐ爱和你が 2024-11-09 18:29:18 2 0

从 lxml 选择属性值

我想使用 xpath 表达式来获取属性的值。 我期望以下内容能够工作 from lxml import etree for customer in etree.parse('file.xml').getroot().findal…

流殇 2024-11-09 12:59:14 1 0

Python lxml 包装元素

我想知道使用 lxml 和 Python 将一个元素与另一个元素包装的最简单方法是什么,例如,如果我有一个 html 片段: The cool title Something Neat aaa b…

与君绝 2024-11-08 02:22:53 2 0

寻找£使用 lxml 签名

我正在努力解决编码和 lxml 问题。我正在阅读网站上的一些 html,并希望使用 lxml 搜索文本中包含 £ 的标签。我可以搜索标签(h3)并让内容打印正常,…

超可爱的懒熊 2024-11-07 22:01:42 1 0

使用 python etree.iterparse() 解析巨大的 xml 文件无法正常工作。代码有逻辑错误吗?

我想解析一个巨大的 xml 文件。这个巨大文件中的记录确实看起来像这个。一般来说,该文件看起来像这样, record_1 ... record_n 我编写了一些代码,这…

流心雨 2024-11-07 17:03:35 4 0

如何将 dtd 验证添加到 `xml.etree.cElementTree.iterparse`

我知道,这种在解析 xml 文件之前进行 dtd 验证的方法是有效的: from lxml import etree context = etree.iterparse(PATH_TO_XML, dtd_validation=Tr…

多孤肩上扛 2024-11-07 16:55:49 4 0

lxml etree 的 Python 对象包装器?

给定 lxml.etree 是否可以以某种方式构造树的对象表示,以便可以以类似对象的方式访问子元素(使用“.”运算符)? 我知道 lxml 有一个名为 objectify…

二智少女猫性小仙女 2024-11-06 16:28:07 1 0

在 python 中从 XML 中提取项目列表

在 python 中,从以下 xml 中提取项目列表的最佳方法是什么?

〆凄凉。 2024-11-05 23:34:37 3 0

用于解析 XML 中模板标签的正则表达式

我需要解析一些 XML 以提取嵌入的模板标签以进行进一步解析。不过,我似乎无法改变 Python 的正则表达式来完成我想要的事情。 英文:当行中的任何位置…

草莓味的萝莉 2024-11-04 14:11:32 2 0

使用 lxml 解析 RSS 时出现编码错误

我想用lxml解析下载的RSS,但我不知道如何处理UnicodeDecodeError? request = urllib2.Request('http://wiadomosci.onet.pl/kraj/rss.xml') response…

喜爱纠缠 2024-11-04 02:15:49 4 0

lxml findall() 问题

只是尝试编写一个简单的程序来获取维基百科的最新更改并解析该 XML 文件。 我陷入了 findall() 不起作用的地步。我做错了什么? import urllib2 from …

优雅的叶子 2024-11-03 10:53:33 4 0

如何使用 lxml 和 iterlinks 替换链接

我是 lxml 新手,我正在尝试弄清楚如何使用 iterlinks() 重写链接。 import lxml.html html = lxml.html.document_fromstring(doc) for element, attr…

淡写薰衣草的香 2024-11-03 09:13:32 3 0
更多

推荐作者

daid

文章 0 评论 0

我心依旧

文章 0 评论 0

晒暮凉

文章 0 评论 0

微信用户

文章 0 评论 0

DS

文章 0 评论 0

〆凄凉。

文章 0 评论 0

更多

友情链接

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文