lxml

lxml

文章 28 浏览 85

Python 的 javascript 感知 html 解析器 ~

&lthtml&gt &lthead&gt &ltscript type="text/javascript"&gt document.write('&lta href="http://www.google.com"&gtf*** js&lt/a&gt') document.wri…

指尖凝香 2024-10-09 12:48:58 0 0

lxml objectify 不会调用自定义元素类的构造函数

lxml.objectify 似乎没有调用我的自定义元素类的构造函数: from lxml import objectify, etree class CustomLookup(etree.CustomElementClassLookup)…

泛泛之交 2024-10-08 11:39:22 0 0

python中定义变量的问题

我试图通过这段代码编写一些xml, docs = XmlReportGenerator() docs.AddMatchRow('FC Barcelona','Madryt','5:0') docs.Save() 并且编写了自己的方法…

下壹個目標 2024-10-08 10:03:56 0 0

如何使用 lxml 抓取 XML 文档的特定部分?

我正在使用亚马逊的 API 来接收有关书籍的信息。我正在尝试使用 lxml 提取我的应用程序所需的 XMl 文档的特定部分。 不过,我不太确定如何使用 lxml。…

甜尕妞 2024-10-07 16:19:55 0 0

CSS 选择器:选择(父|子)与 X 不匹配的元素

我想选择一个没有特定类型子元素的元素,例如: 所有没有 &lt 的 元素/code&gt 子元素,我只想选择父元素,而不是与表不匹配的子元素。 同样,我想匹…

揽清风入怀 2024-10-07 05:27:41 0 0

lxml.etree 和 xml.etree.ElementTree 添加没有前缀的命名空间(ns0、ns1 等)

有没有任何解决方案可以添加不带前缀的名称空间(我的意思是这些 ns0、ns1),该名称空间适用于所有 etree 实现,或者每个都有可行的解决方案? 现在…

乄_柒ぐ汐 2024-10-07 05:13:47 0 0

urllib2/lxml 编码问题

我是 python 新手,尝试使用 urllib2/lxml 来获取和解析页面。一切似乎都工作正常,除了解析的页面在我的浏览器中打开时似乎嵌入了奇怪的字符。我猜这…

非要怀念 2024-10-07 02:04:32 0 0

lxml --pretty_print--写入文件问题

我正在将原始数据写入xml文件python程序,在我的设计中,我们逐行获取原始数据, 然后将其写入 xml 文件,例如: `&ltroot&gt\n &lta&gt value &lt/a&…

慢慢从新开始 2024-10-06 19:55:15 0 0

解析 HTML:Python 中的 lxml 错误

我正在编写一个简单的脚本来从此处获取大灰色表格。 我的代码如下: import urllib2 from lxml import etree html = urllib2.urlopen("http://www.afi…

紙鸢 2024-10-06 19:12:02 0 0

Python 中的 Html 元素位置

我正在使用 lxml.html 在 python 中进行一些 html 解析。我想粗略估计浏览器渲染页面后元素在页面中的位置。它不一定是精确的,但大体上是正确的。为…

云醉月微眠 2024-10-05 19:56:31 1 0

使用 .py 文件中的 lxml 时遇到问题。它与口译员一起工作

我的 Snow Leopard 上安装了 python.org v2.7。还有一个 Apple 2.6 Python。我使用“sudo pip install lxml”命令 pip 安装了 lxml。我确保我是在 pyt…

八巷 2024-10-05 19:47:51 1 0

如何加快 lxml 的构建/安装速度?

我们使用 Hudson-CI 作为 Python 项目的持续集成服务器,所有这些都使用 Buildout 来管理依赖项。几乎我们所有的项目都使用 lxml,由于 Buildout,它…

病毒体 2024-10-05 08:08:05 0 0

Python,XPath:查找所有图像链接

我在 Python 中使用 lxml 来解析一些 HTML,我想提取所有图像链接。我现在的做法是: //a[contains(@href,'.jpg') or contains(@href,'.jpeg') or ...…

蓝戈者 2024-10-05 07:09:00 0 0

在 Python 中从 amara 切换到 lxml

我正在尝试使用 lxml 库完成这样的事情: http://www.xml.com/pub/a/2005 /01/19/amara.html from amara import binderytools container = binderytoo…

挖鼻大婶 2024-10-04 05:42:27 0 0

Python、BeautifulSoup 或 LXML - 使用 CSS 标签从 HTML 解析图像 URL

我四处寻找有关 BeautifulSoup 或 LXML 如何工作的合理解释。诚然,他们的文档很棒,但对于像我这样的 python/编程新手来说,很难破译我正在寻找的内…

鹿港小镇 2024-10-04 04:24:22 0 0
更多

推荐作者

lioqio

文章 0 评论 0

Single

文章 0 评论 0

禾厶谷欠

文章 0 评论 0

alipaysp_2zg8elfGgC

文章 0 评论 0

qq_N6d4X7

文章 0 评论 0

放低过去

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文