第 8 页 - lxml - 文江博客

投稿关注

lxml

文章 28 浏览 87

从 lxml.objectify.ObjectifiedElement 中剥离 python 命名空间属性

可能的重复：使用 lxml 时，是否可以在不使用 lxml 的情况下渲染 XML命名空间属性？如何从 lxml.objectify.ObjectifiedElement 中剥离 python 属性…

无法言说的痛 2024-11-10 02:00:52 4 0

Python lxml/beautiful soup 查找网页上的所有链接

我正在编写一个脚本来读取网页，并构建符合特定条件的链接数据库。现在我陷入了 lxml 并理解如何从 html 中获取所有 's ... result = self._openurl(s…

燕归巢 2024-11-10 01:30:21 1 0

在 lxml 中迭代时就地编辑树

我正在使用 lxml 来解析 html 并编辑它以生成一个新文档。本质上，我尝试像 javascript DOM 一样使用它 - 我知道这并不是真正的预期用途，但到目前为…

优雅的叶子 2024-11-09 22:50:42 1 0

相当于使用lxml.html解析HTML时的InnerHTML

我正在编写一个使用 lxml.html 解析网页的脚本。我曾经做过相当多的 BeautifulSoup，但由于 lxml 的速度，我现在正在尝试它。我想知道库中最明智的方…

溺ぐ爱和你が 2024-11-09 18:29:18 2 0

从 lxml 选择属性值

我想使用 xpath 表达式来获取属性的值。我期望以下内容能够工作 from lxml import etree for customer in etree.parse('file.xml').getroot().findal…

流殇 2024-11-09 12:59:14 1 0

Python lxml 包装元素

我想知道使用 lxml 和 Python 将一个元素与另一个元素包装的最简单方法是什么，例如，如果我有一个 html 片段： The cool title Something Neat aaa b…

与君绝 2024-11-08 02:22:53 2 0

寻找£使用 lxml 签名

我正在努力解决编码和 lxml 问题。我正在阅读网站上的一些 html，并希望使用 lxml 搜索文本中包含 £ 的标签。我可以搜索标签（h3）并让内容打印正常，…

超可爱的懒熊 2024-11-07 22:01:42 1 0

使用 python etree.iterparse() 解析巨大的 xml 文件无法正常工作。代码有逻辑错误吗？

我想解析一个巨大的 xml 文件。这个巨大文件中的记录确实看起来像这个。一般来说，该文件看起来像这样， record_1 ... record_n 我编写了一些代码，这…

流心雨 2024-11-07 17:03:35 4 0

如何将 dtd 验证添加到 `xml.etree.cElementTree.iterparse`

我知道，这种在解析 xml 文件之前进行 dtd 验证的方法是有效的： from lxml import etree context = etree.iterparse(PATH_TO_XML, dtd_validation=Tr…

多孤肩上扛 2024-11-07 16:55:49 4 0

lxml etree 的 Python 对象包装器？

给定 lxml.etree 是否可以以某种方式构造树的对象表示，以便可以以类似对象的方式访问子元素（使用“.”运算符）？我知道 lxml 有一个名为 objectify…

二智少女猫性小仙女 2024-11-06 16:28:07 1 0

在 python 中从 XML 中提取项目列表

在 python 中，从以下 xml 中提取项目列表的最佳方法是什么？

〆凄凉。 2024-11-05 23:34:37 3 0

用于解析 XML 中模板标签的正则表达式

我需要解析一些 XML 以提取嵌入的模板标签以进行进一步解析。不过，我似乎无法改变 Python 的正则表达式来完成我想要的事情。英文：当行中的任何位置…

草莓味的萝莉 2024-11-04 14:11:32 2 0

使用 lxml 解析 RSS 时出现编码错误

我想用lxml解析下载的RSS，但我不知道如何处理UnicodeDecodeError？ request = urllib2.Request('http://wiadomosci.onet.pl/kraj/rss.xml') response…

喜爱纠缠 2024-11-04 02:15:49 4 0

lxml findall() 问题

只是尝试编写一个简单的程序来获取维基百科的最新更改并解析该 XML 文件。我陷入了 findall() 不起作用的地步。我做错了什么？ import urllib2 from …

优雅的叶子 2024-11-03 10:53:33 4 0

如何使用 lxml 和 iterlinks 替换链接

我是 lxml 新手，我正在尝试弄清楚如何使用 iterlinks() 重写链接。 import lxml.html html = lxml.html.document_fromstring(doc) for element, attr…

淡写薰衣草的香 2024-11-03 09:13:32 3 0

共 18 页
上一页
6
7
8
9
10
下一页

关注

友情链接

文江博客