令人难以置信的基本 lxml 问题:获取 lxml.etree._Element 的 HTML/字符串内容?

发布于 2024-10-24 15:37:11 字数 408 浏览 2 评论 0原文

这是一个非常基本的问题,我实际上在文档中找不到它:-/

在以下内容中:

img = house_tree.xpath('//img[@id="mainphoto"]')[0]

如何获取 标记的 HTML?

我尝试添加 html_content() 但得到 AttributeError: 'lxml.etree._Element' object has no attribute 'html_content'

另外,它是一个内部包含一些内容的标签(例如

text

),我如何获取内容(例如 text)?

非常感谢!

This is such a basic question that I actually can't find it in the docs :-/

In the following:

img = house_tree.xpath('//img[@id="mainphoto"]')[0]

How do I get the HTML of the <img/> tag?

I've tried adding html_content() but get AttributeError: 'lxml.etree._Element' object has no attribute 'html_content'.

Also, it was a tag with some content inside (e.g. <p>text</p>) how would I get the content (e.g. text)?

Many thanks!

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

南巷近海 2024-10-31 15:37:11

我想它会像这样简单:

from lxml.etree import tostring
inner_html = tostring(img)

至于从

内部获取内容,比如说,一些选定的元素 el

content = el.text_content()

I suppose it will be as simple as:

from lxml.etree import tostring
inner_html = tostring(img)

As for getting content from inside <p>, say, some selected element el:

content = el.text_content()
~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文