用于检查字符串是否有效的 XHTML 的正则表达式
可能的重复:
用于检查字符串是否为有效 XML 的正则表达式 < /p>
I我正在寻找正则表达式来检查字符串是否有效 XHTML
示例
<h2>Legal HTML Entity References</h2><table align="center" border="0" ><tr></tr></table>
Possible Duplicate:
regular expression to check if string is valid XML
I am looking Regular Expression to check String is Valid XHTML or not
example
<h2>Legal HTML Entity References</h2><table align="center" border="0" ><tr></tr></table>
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(4)
这听起来像是一个坏主意:有效的 XHTML 字符串的语言不规则。
请改用 HTML 解析库。几个例子:
相关问题:
This sounds like a bad idea: The language of valid XHTML strings is not regular.
Use an HTML parsing library instead. A few examples:
Related question:
正则表达式是完全错误的工具。
请参阅 Jeff 关于该主题的帖子:
http://www.codinghorror.com/blog /2009/11/parsing-html-the-cthulhu-way.html
由于您已将这篇文章标记为 Java,因此您应该考虑使用无数 HTML 解析库之一 可用的。
Regex is exactly the wrong tool to use.
See Jeff's post on the subject here:
http://www.codinghorror.com/blog/2009/11/parsing-html-the-cthulhu-way.html
Since you've tagged this post Java, you should look at using one of the myriad of HTML parsing libraries available.
看看这里为什么使用正则表达式解析 HTML 不能可靠地工作: 正则表达式匹配除 XHTML 自包含标签之外的开放标签
XHTML 只是 HTML 的另一种风格/超集,因此您最好使用真正的验证器,例如 JTidy 等。
Have a look here why parsing HTML using regular expressions won't work reliably: RegEx match open tags except XHTML self-contained tags
XHTML is just another flavor/superset of HTML, so you're better of using a real validator, like JTidy etc.
尝试用解析器检查它。不要采用克苏鲁方式。
您可以在这里找到一个策略点和一些有关如何执行此操作的示例: Java XML 验证 API
Try to check it with a parser. Don't do it the Cthulhu Way.
Here you can find a strating point and some examples on how to do it: The Java XML Validation API