lxml

lxml

文章 28 浏览 87

如何在 Ubuntu 10.10 上安装 Python 2.7 模块?

在 Ubuntu 10.10 上,我无法将 lxml 安装到 python 2.7。这是我采取的步骤。 sudo su - apt-get install python2.7 apt-get install python-lxml 请注…

绮筵 2024-10-18 20:22:03 9 0

使用 objectify 获取具有不同名称空间前缀的项目

Hello World! USA 我想使用 lxml.objectify 来访问“Hello World!”和“美国”。怎么办呢?我不关心效率,只关心节俭。我已经尝试了我能想到的一切,…

紫瑟鸿黎 2024-10-18 06:35:23 7 0

使用lxml在python中提取段落

我想用python提取html中的段落。我使用了 lxml 模块,但它并不完全符合我的要求。 print html.parse(url).xpath('//p')[1].text_content() Here is th…

琴流音 2024-10-17 16:30:19 7 0

python 和 lxml 的空格问题

我正在尝试使用 python 和 lxml 抓取这个网站。 它在我的本地计算机上工作得很好,但是当我尝试将它部署在我的服务器上并运行脚本时,我遇到了空格问…

爱你是孤单的心事 2024-10-17 11:13:07 2 0

使用 Python 转义 XML 中未转义的字符

我需要转义大约 5000 行长的无效 XML 文件中的特殊字符。下面是我必须处理的 XML 示例: name & surname [email protected] 这里的问题是字符“&”在…

晒暮凉 2024-10-17 04:14:25 5 0

lxml cssselect 解析

我有一个包含以下数据的文档: 1. A domesticated carnivorous mammal (Canis familiaris) related to the foxes and wolves and raised in a wide va…

猫七 2024-10-16 04:52:24 5 0

有条件地迭代列表中的项目的 Pythonic 方法

一般来说,编程新手,所以我可能会以错误的方式进行处理。我正在编写一个 lxml 解析器,我想忽略解析器输出中没有内容的 HTML 表行。这就是我所得到的…

萌酱 2024-10-15 22:15:39 3 0

使用 Python lxml 模块保留文本节点中的特殊字符

我正在编辑第三方提供的 XML 文件。 XML 用于重新创建整个环境,并且可以编辑 XML 以传播更改。我能够通过命令行选项查找想要更改的元素并保存 XML,…

梦里兽 2024-10-15 15:28:24 6 0

如何使用lxml查找XHTML文档中的元素文本

我已经为此苦恼了很多年,我一定是做了一些愚蠢的事情。 我正在尝试检索所有可能的维基百科支持的语言,并通过遍历 List_of_Wikipedias 上的表将它们…

风苍溪 2024-10-14 05:51:21 5 0

请帮助使用 BeautifulSoup 和 lxml 以 pythonic 方式解析此 html 表

我搜索了很多关于 BeautifulSoup 的信息,有些人建议 lxml 作为 BeautifulSoup 的未来,虽然这是有道理的,但我很难从网页上的整个表格列表中解析下表…

溺渁∝ 2024-10-13 18:31:44 9 0

Python:在本地/特定元素上使用 xpath

我正在尝试使用 xpath 从页面获取链接。问题是我只想要表格内的链接,但如果我在整个页面上应用 xpath 表达式,我将捕获我不想要的链接。 例如: tree…

负佳期 2024-10-13 17:04:18 5 0

lxml.etree、element.text 不返回元素的整个文本

我通过 xpath 废弃了一些 html,然后将其转换为 etree。与此类似: text1 link text2 但是当我调用 element.text 时,我只得到 text1 (它必须在那里…

零時差 2024-10-13 09:38:15 11 0

在lxml中,如何删除标签但保留所有内容?

问题是这样的:我有一个像这样的 XML 片段: text1 inner1 text2 inner2 text3 对于结果,我想删除所有 - 和 - 标签,但是保留它们的(文本)内容和子…

坏尐絯 2024-10-12 10:39:44 6 0

使用 xslt 构建 django 模板文件

我有大约 4,000 个 html 文档,我正在尝试使用 xslt 将它们转换为 django 模板。我遇到的问题是,当我尝试在属性标记内包含模板变量时,xslt 正在转义…

撩人痒 2024-10-11 21:09:37 8 0

对 lxml 节点的引用

我正在迭代从 xpath 查询中获得的 xml 节点值。我需要分配对某个节点值的引用。 我想要的是: from lxml import etree doc = etree.fromstring(some_x…

柳若烟 2024-10-11 11:38:26 5 0
更多

推荐作者

爱人如己

文章 0 评论 0

萧瑟寒风

文章 0 评论 0

云雾

文章 0 评论 0

倒带

文章 0 评论 0

浮世清欢

文章 0 评论 0

撩起发的微风

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文