如何在 Python 中生成 HTML 文本的目录?
假设我有一些 HTML 代码,如下所示(从 Markdown 或 Textile 等生成):
<h1>A header</h1>
<p>Foo</p>
<h2>Another header</h2>
<p>More content</p>
<h2>Different header</h2>
<h1>Another toplevel header
<!-- and so on -->
我如何使用 Python 为其生成目录?
Assume that I have some HTML code, like this (generated from Markdown or Textile or something):
<h1>A header</h1>
<p>Foo</p>
<h2>Another header</h2>
<p>More content</p>
<h2>Different header</h2>
<h1>Another toplevel header
<!-- and so on -->
How could I generate a table of contents for it using Python?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(2)
使用 HTML 解析器,例如 lxml 或 BeautifulSoup 查找所有标题元素。
Use an HTML parser such as lxml or BeautifulSoup to find all header elements.
这是使用 lxml 和 xpath 的示例。
Here's an example using lxml and xpath.