lxml

lxml

文章 28 浏览 87

使用 Python lxml 和 Iterparse 解析大型 XML 文件

我正在尝试使用 lxml 和 iterparse 方法编写一个解析器来单步执行包含许多项目的非常大的 xml 文件。 我的文件格式为: Item 1 Description 1 http://…

逆蝶 12-01 09:43 5 0

使用 Python Iterparse 处理大型 XML 文件

我需要用 Python 编写一个解析器,它可以在没有太多内存(只有 2 GB)的计算机上处​​理一些非常大的文件(> 2 GB)。我想在 lxml 中使用 iterparse …

榕城若虚 12-01 06:16 4 0

lxml 是否根据上下文解析 HTML?

我使用 lxml 来解析 HTML: >>> from lxml.html import fromstring, tostring 在某些情况下它会正确解析尾随空格: >>> html = """some text """ >>> …

萌梦深 12-01 04:59 0 0

fromstring() ->; tostring() 修改整个 HTML 结构

我正在尝试使用 lxml.html 编写一个清理例程来删除 没有内容的空 DIV 元素。在调试过程中我注意到 标准 tostring() -> fromstring() 迭代修改了我的 H…

想念有你 11-30 21:53 1 0

在python中使用Etree解析XML配置文件

请帮我使用 lxml etree 解析以下原型的配置文件。我尝试使用 for event, element 和 tostring。不幸的是,我不需要文本,而是 给定属性之间的 XML。 …

踏雪无痕 11-30 00:49 1 0

是否可以在不生成可见窗口的情况下使用 Selenium/Python?我可以使用 lxml 吗?

我希望能够保存页面,然后使用 lxml.html.parse() 但我想知道是否可以直接在打开的页面上执行此操作? 我正在使用 Ubuntu,如果它有什么区别的话。 编…

小女人ら 11-29 06:24 2 0

Python:使用“lxml.html”将 HTML 内容注入到标签中

我正在使用 lxml.html 库来解析 HTML 文档。 我找到了一个名为 content_tag 的特定标记,并且我想更改其内容(即 和 之间的文本)。 ,),新内容是一个…

Saygoodbye 11-29 01:16 1 0

python 中的 lxml iterparse 无法处理命名空间

from lxml import etree import StringIO data= StringIO.StringIO('OneTwoThree') docs = etree.iterparse(data,tag='a') a,b = docs.next() Traceba…

剧终人散尽 11-28 17:30 3 0

在 etree 上使用 iterdescendants() 时,可以修改树吗?

(Python 3.2) 我正在使用 etree 来解析一些 XML。为此,我使用 iterdescendants() 递归地迭代文档。所以,就像: for elem in doc.iterdescendants():…

ゝ偶尔ゞ 11-28 08:12 1 0

lxml Pretty_print python 内存过载

我有一个格式不正确的 xml 文件,其中包含超过 350 MB 的数据。基本上,所有数据都合并到一行中。我正在尝试将其漂亮打印到一个新文件中以使生活更轻…

落花随流水 11-27 18:36 1 0

lxml:获取具有特定子元素的元素?

在 lxml 中工作,我想获取具有 title="Go to next page" 的 img 子项的所有链接的 href 属性。 因此,在以下代码片段中: 我想取回 StdResults.aspx …

一袭水袖舞倾城 11-27 17:30 0 0

如何在空命名空间节点上使用 lxml 中的 xpath?

使用 lxml 处理 xml 文档中某些节点缺少命名空间的最佳方法是什么?我是否应该首先修改所有 None 命名节点以添加“gmd”名称,然后将树属性更改为名称…

街角迷惘 11-27 08:56 2 0

使用 Python 的 lxml 通过 id 查找并替换 XML/SVG 元素文本?

我是 XML 和 lxml 的新手,希望使用 SVG 作为图形模板并以编程方式替换一些元素(图像中的标签)。 为此,我使用 Inkscape 创建了一个 SVG 文件,但是…

娇纵 11-27 07:36 1 0

Mac 上的 lxml 安装问题

我正在尝试在本地 Mac 上安装 Collective.xdv。我按照此处的说明进行操作:http://plone。 org/products/collective.xdv/documentation/tutorial/adva…

灵芸 11-27 04:43 2 0

Python 中最宽容的 HTML 解析器是什么?

我有一些随机的 HTML,我使用 BeautifulSoup 来解析它,但在大多数情况下(> 70%)它会令人窒息。我尝试使用Beautiful soup 3.0.8和3.2.0(3.1.0以上…

陪我终i 11-26 17:01 2 0
更多

推荐作者

亚希

文章 0 评论 0

cyp

文章 0 评论 0

北漠

文章 0 评论 0

11223456

文章 0 评论 0

坠似风落

文章 0 评论 0

游魂

文章 0 评论 0

我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文