使用 python 比较 XML 和 unicode

发布于 2024-10-31 19:21:01 字数 164 浏览 5 评论 0原文

我正在尝试创建一个 Web 工具,可以可视化两个 XML 之间的差异。 difflib 在创建具有差异的 html 方面工作得很好,但随后一些 unicode 文本出现在 XML 中,并且生成的 html 现在包含 html 编码的字母。

还有其他方法可以解决这个问题吗?

I'm trying to create a web tool that can visualize the differences between two XMLs. difflib was working pretty well in creating html with the differences, but then some unicode text showed up in the XMLs and the resulting html now contains html-encoded letters.

Is there any other approach to this problem?

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

没有伤那来痛 2024-11-07 19:21:01

我认为困扰您的是“html 字符实体”,而不是它们的数字对应项。您可以重新映射它们,例如通过您最喜欢的支持正则表达式的 cli 工具(例如 sed)和 unicode e-workers参考。数字实体编码可以用在 html 和 xml 文件中。

最好的问候,卡斯滕

i assume what bothers you are 'html character entities', not their numerical counterparts. you may re-map them e.g. by means of your favorite cli tool supporting regexes (eg. sed) and the tables from unicode e-workers or the reference. the numerical entity encoding may be used in html and xml files alike.

best regards, carsten

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文