是否有一个 perl 模块可以用实际字符替换 HTML/XML 字符代码?
我有一个包含 XML 字符代码的字符串(例如 &
、<
等)。我想知道是否有一个模块可以用来自动用实际字符替换这些字符代码。
我知道我可以编写一个简单的搜索/替换正则表达式,但是我必须确保我没有丢失任何字符代码;这似乎是由某些现有模块处理的事情类型。
谢谢!
I have a string with XML character codes in it (e.g. &
, <
, etc.). I was wondering if there is a module that I can use to automatically replace these character codes with the actual characters.
I know that I can write a simple search/replace regex, but then I'd have to make sure I'm not missing any character codes; it seems like the type of thing that would be handled by some existing module.
Thanks!
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(2)
嗯...您的 HTML 或 XML 解析器应该会为您做这件事。
对于 HTML,您可以使用 HTML::Entities。
对于 XML,实体定义基于架构和文档本身,因此它确实必须是 XML 解析过程的一部分。 XML 本身知道的唯一命名实体是
&
、<
、>
、& ’
和"
,但 XML 文档可以使用无限范围的可能实体中的任何一个。Hum... Your HTML or XML parser should be doing that for you.
For HTML, you can use HTML::Entities.
For XML, the entity definitions are based on the schema and on the document itself, so it really has to be part of the XML parsing process. The only named entities XML itself knows about are
&
,<
,>
,'
and"
, but an XML document can use any from an inifinite range of possible entities.听起来您正在寻找
HTML::Entities
来自HTML::Parser
。Sounds like you're looking for
HTML::Entities
fromHTML::Parser
.