python 处理数据中的 XML 解析 expat

发布于 2024-07-27 18:28:39 字数 431 浏览 4 评论 0原文

我正在尝试使用 python expat 解析 XML 文件。我的 XML 文件中有以下行：

<Action>&lt;fail/&gt;</Action>

expat 标识开始和结束标记，但将 & 转换为 LT；小于字符和大于字符相同，因此解析它如下：

结果：

START 'Action'
DATA '<'
DATA 'fail/'
DATA '>'
END 'Action'

而不是期望的：

START 'Action'
DATA '&lt;fail/&gt;'
END 'Action'

我想得到期望的结果，如何防止外籍人士搞砸？

原文

I am attempting to parse an XML file using python expat. I have the following line in my XML file:

<Action><fail/></Action>

expat identifies the start and end tags but converts the & lt; to the less than character and the same for the greater than character and thus parses it like this:

outcome:

START 'Action'
DATA '<'
DATA 'fail/'
DATA '>'
END 'Action'

instead of the desired:

START 'Action'
DATA '<fail/>'
END 'Action'

I would like to have the desired outcome, how do I prevent expat from messing up?

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

风苍溪 2024-08-03 18:28:39

expat 不会搞乱，< 只是字符 < 的 XML 编码。恰恰相反，如果 expat 返回文字 <，这将是 XML 规范的一个错误。话虽如此，您当然可以使用 xml.sax.saxutils.escape 取回转义版本：

>>> from xml.sax.saxutils import escape
>>> escape("<fail/>")
'<fail/>'

expat 解析器还可以自由地以任何看起来合适的块报告所有字符串数据，因此您必须自己连接它们。

expat does not mess up, < is simply the XML encoding for the character <. Quite to the contrary, if expat would return the literal <, this would be a bug with respect to the XML spec. That being said, you can of course get the escaped version back by using xml.sax.saxutils.escape:

>>> from xml.sax.saxutils import escape
>>> escape("<fail/>")
'<fail/>'

The expat parser is also free to report all string data in whatever chunks it seems fit, so you have to concatenate them yourself.

回复收藏 0 原文

乞讨 2024-08-03 18:28:39

SAX 和 StAX 解析器都可以以任何方便的方式自由地分解字符串（尽管 StAX 有一个 COALESCE 模式来强制它为您组装各个部分）。

原因是，在某些情况下通常可以编写流式传输的软件，而不必关心重新组装字符串片段的开销。

通常我会在变量中累积文本，并在看到下一个 StartElement 或 EndElement 事件时使用内容。此时，我还将累积文本变量重置为空。

回复收藏 0 原文

~没有更多了~

关于作者

就是爱搞怪

暂无简介

0 文章

0 评论

23 人气

关注发私信

友情链接

文江博客

python 处理数据中的 XML 解析 expat

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

留蓝

18790681156

zach7772

Wini

ayeshaaroy

初雪

友情链接

python 处理数据中的 XML 解析 expat

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

留蓝

18790681156

zach7772

Wini

ayeshaaroy

初雪

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。