使用 python 比较 XML 和 unicode
我正在尝试创建一个 Web 工具,可以可视化两个 XML 之间的差异。 difflib
在创建具有差异的 html 方面工作得很好,但随后一些 unicode 文本出现在 XML 中,并且生成的 html 现在包含 html 编码的字母。
还有其他方法可以解决这个问题吗?
I'm trying to create a web tool that can visualize the differences between two XMLs. difflib
was working pretty well in creating html with the differences, but then some unicode text showed up in the XMLs and the resulting html now contains html-encoded letters.
Is there any other approach to this problem?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
我认为困扰您的是“html 字符实体”,而不是它们的数字对应项。您可以重新映射它们,例如通过您最喜欢的支持正则表达式的 cli 工具(例如 sed)和 unicode e-workers 或参考。数字实体编码可以用在 html 和 xml 文件中。
最好的问候,卡斯滕
i assume what bothers you are 'html character entities', not their numerical counterparts. you may re-map them e.g. by means of your favorite cli tool supporting regexes (eg. sed) and the tables from unicode e-workers or the reference. the numerical entity encoding may be used in html and xml files alike.
best regards, carsten