当前位置：文江博客话题详情

Python Elementtree：忽略未定义的前缀

发布于 2024-12-11 05:09:47 字数 181 浏览 4 评论 0原文

我有很多从各种来源收集的 XML“片段”。由于这些不是完全形成的 XML 文档，因此相当多的文档没有声明其标签前缀，例如 等标签。段落文本

使用 Python 中的 ElementTree 来解析这些文本，经常会遇到无界前缀错误。是否有一个开关可以让解析器一起忽略前缀？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

沧桑㈠ 2024-12-18 05:09:47

我认为 lxml 和 elementtree 不能同时使用。 XMLParser 上的选项是有限的。错误消息来自 expat 解析器库。处理它的方法是在解析之前声明一个名称空间。

在 XPath 中，有一种方法可以仅获取本地名称

//*[local-name()='p']

，但正如文档中提到的，XPath 并未在 elementtree 中完全实现。

I do not think you can with both lxml and elementtree. The options on XMLParser are limited. The error message is coming from the expat parser library. The way to deal with it would be to declare a namespace before the parsing.

In XPath, there is a way to only get the local-name

//*[local-name()='p']

but XPath is not fully implemented in elementtree as mentionned in the documentation.

回复收藏 0 原文

~没有更多了~

关于作者

深居我梦

暂无简介

文章

26 人气

关注发私信

著墨染雨君画夕

文章 0 评论 0

关注

屋檐

文章 0 评论 0

关注

最后的乘客

文章 0 评论 0

关注

眼前雾蒙蒙

文章 0 评论 0

关注

kidking

文章 0 评论 0

关注

kill136

文章 0 评论 0

友情链接

文江博客

Python Elementtree：忽略未定义的前缀

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签