浏览 lxml 类别

发布于 2024-12-12 03:44:07 字数 326 浏览 0 评论 0原文

我有一个解析网络,现在我想浏览标签或显示图表。 我怎样才能得到图表?或者浏览树。显示第一步,然后显示其他步骤等。并了解这棵树是如何建造的。

import urllib
from lxml import etree
import StringIO
resultado=urllib.urlopen('trozo.html')
html = resultado.read()
parser= etree.HTMLParser()
tree=etree.parse(StringIO.StringIO(html),parser)

我只想检查节点!图表会很酷,但我只想检查一下!

I have a parse a web and now I want to navigate through the tags, or show a graph.
How can I get a graph? Or navigate through the tree. Showing the first step then other,etc. And understant how the tree was built.

import urllib
from lxml import etree
import StringIO
resultado=urllib.urlopen('trozo.html')
html = resultado.read()
parser= etree.HTMLParser()
tree=etree.parse(StringIO.StringIO(html),parser)

I only want to examine the nodes! A graph will be cool but I only want to examine it!

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

救星 2024-12-19 03:44:07

您已经完成了解析,如果执行以下操作,您就可以看到解析结果:

>>> tree
<lxml.etree._ElementTree object at 0x0148AF08>

现在您可以使用 lxml._ElementTree 函数来遍历此元素,记录如下:http://lxml.de/tutorial.html

以下是一些基础知识,以及我从本地网络获得的一个简单文件:

>>> tree.getroot()
<Element html at 147aae0>
>>> tree.getroot().tag
'html'
>>> tree.getroot().text
>>> for child in tree.getroot().getchildren():
        print child.tag, child.getchildren()
head
body
>>> for child in tree.getroot().getchildren():
        print child.tag, [sub_child.tag for sub_child in child.getchildren()]
head ['title']
body ['h1', 'p', 'hr', 'address']

You achieved the parsing, which you can see if you do the following:

>>> tree
<lxml.etree._ElementTree object at 0x0148AF08>

Now you can go through this element using lxml._ElementTree functions, documented here: http://lxml.de/tutorial.html

Here are some basics, with a simple file I got from my local network:

>>> tree.getroot()
<Element html at 147aae0>
>>> tree.getroot().tag
'html'
>>> tree.getroot().text
>>> for child in tree.getroot().getchildren():
        print child.tag, child.getchildren()
head
body
>>> for child in tree.getroot().getchildren():
        print child.tag, [sub_child.tag for sub_child in child.getchildren()]
head ['title']
body ['h1', 'p', 'hr', 'address']
~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文