lxml

lxml

文章 28 浏览 85

用 lxml.html 替换元素

我对 lxml 和 HTML 解析器整体来说还很陌生。 我想知道是否有一种方法可以用另一个元素替换树中的一个元素... 例如我有: body = """&ltcode&gt def f…

叹沉浮 2024-08-12 16:48:16 4 0

有没有办法用 lxml 解析 html,但用 minidom 操作它?

我有一个应用程序,我一直在使用 html5lib 来自由地解析 html。我使用 minidom 接口,因为我需要一个真正的 DOM API,而 ElementTree 不适合我正在做…

时间海 2024-08-11 22:50:12 2 0

lxml 是否可以以不区分大小写的方式工作?

我正在尝试从任意网站抓取 META 关键字和描述标签。显然我无法控制该网站,所以必须接受我所得到的。它们的标签和属性有多种大小写,这意味着我需要不…

冷情 2024-08-11 04:03:23 5 0

Lxml html xpath 上下文

我正在使用 lxml 解析 HTML 文件,我想知道如何设置 xpath 搜索的 context 。我的意思是,我有一个节点元素,并且希望仅在该节点内部进行 xpath 搜索…

终陌 2024-08-11 00:09:31 4 0

如何获取lxml中元素的路径?

我正在使用 python 中的 lxml 中的 XPath 在 HTML 文档中进行搜索。如何获取某个元素的路径?以下是 ruby​​ nokogiri 的示例: page.xpath('//text(…

音盲 2024-08-08 04:15:51 5 0

奇怪的 lxml 行为

考虑以下代码片段: import lxml.html html = '&ltdiv&gt&ltbr /&gtHello text&lt/div&gt' doc = lxml.html.fromstring(html) text = doc.xpath('//te…

仅此而已 2024-08-07 18:55:41 1 0

python、lxml 和 xpath - html 表解析

我是 lxml 新手,对 python 很陌生,无法找到以下问题的解决方案: 我需要导入一些具有 3 列和从第 3 行开始的未定义行数的表。 当任何行的第二列是为…

花桑 2024-08-07 11:54:18 1 0

无法安装lxml(python 2.6.3,osx 10.6雪豹)

我尝试: easy_install lxml 我收到此错误: 文件“build/bdist.macosx-10.3-fat/egg/setuptools/command/build_ext.py”,第 85 行,在 get_ext_file…

北陌 2024-08-06 07:45:14 1 0

lxml中属性和样式标签的区别

使用BeautifulSoup后我正在尝试学习lxml。不过,总的来说我并不是一个很强的程序员。 我在一些源 html 中有以下代码: &ltp style="font-family:times…

贩梦商人 2024-08-06 06:13:33 3 0

lxml 相当于 BeautifulSoup “OR”句法?

我正在将一些 html 解析代码从 BeautifulSoup 转换为 lxml。我试图找出以下 BeautifullSoup 语句的 lxml 等效语法: soup.find('a', {'class': ['curr…

妄断弥空 2024-08-03 12:10:26 3 0

如何向 lxml 中的属性添加命名空间

我正在尝试使用 python 和 lxml 创建一个如下所示的 xml 条目: &ltresource href="Unit 4.html" adlcp:scormtype="sco"&gt 我正在使用 python 和 lxm…

归属感 2024-08-03 07:43:27 4 0

如何在不使用 MacPorts 或 Fink 的情况下在 OS X Leopard 上安装 lxml?

我过去曾多次尝试过此操作并遇到问题。 有没有人有在没有 MacPorts 或 Fink 的情况下在 OS X 上安装 lxml 的方法,并且绝对有效? 最好有完整的 1-2-3…

美煞众生 2024-08-01 19:22:32 5 0

更改 lxml 中 etree.tostring 的默认缩进

我有一个 XML 文档,我使用 lxml.etree.tostring 对其进行了漂亮的打印。 print etree.tostring(doc, pretty_print=True) 默认的缩进级别是 2 个空格…

冷︶言冷语的世界 2024-07-30 06:06:12 3 0

如何让 lxml 在 IronPython 下工作?

我需要将一些严重依赖 lxml 的代码从 CPython 应用程序移植到 IronPython。 lxml 非常 Pythonic,我想继续在 IronPython 下使用它,但它依赖于 libxsl…

窗影残 2024-07-29 00:45:51 3 0

lxml 使用 cssselector 检索奇怪的项目

在我的测试文档中,我有几个标记为“item”的类,目前我正在使用以下内容来解析带有此类的html文件中的所有内容, Selection = html.cssselect(".item…

春花秋月 2024-07-28 23:13:48 3 0
更多

推荐作者

qq_FjTq5B

文章 0 评论 0

18273202778

文章 0 评论 0

WordPress小学生

文章 0 评论 0

〃温暖了心ぐ

文章 0 评论 0

迷乱花海

文章 0 评论 0

niuniu

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文