当前位置：文江博客话题详情

用于缩进 XML 文件的正则表达式

发布于 2024-07-13 04:30:38 字数 95 浏览 6 评论 0原文

是否可以编写一个 REGEX（搜索替换），当在 XML 字符串上运行时，该 REGEX 会输出良好缩进的 XML 字符串？

如果是的话，正则表达式是什么:)

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

鹤舞 2024-07-20 04:30:38

是否可以编写一个在 XML 字符串上运行时的 REGEX（搜索替换）[...任何内容]

否。

使用 XML 解析器读取字符串，然后使用 XML 序列化程序以“漂亮”模式将其写回。

每个 XML 处理器都有自己的选项，因此它取决于平台，但以下是适用于 DOM Level 3 LS 兼容实现的有点冗长的方法：

input= implementation.createLSInput();
input.stringData= unprettyxml;
parser= implementation.createLSParser(implementation.MODE_SYNCHRONOUS, null);
document= parser.parse(input);
serializer= implementation.createLSSerializer();
serializer.domConfig.setParameter("format-pretty-print", true);
prettyxml= serializer.writeToString(document);

Is it possible to write a REGEX (search replace) that when run on an XML string [...anything]

No.

Use an XML parser to read the string, then an XML serialiser to write it back out in ‘pretty’ mode.

Each XML processor has its own options so it depends on platform, but here is the somewhat long-winded way that works on DOM Level 3 LS-compliant implementations:

input= implementation.createLSInput();
input.stringData= unprettyxml;
parser= implementation.createLSParser(implementation.MODE_SYNCHRONOUS, null);
document= parser.parse(input);
serializer= implementation.createLSSerializer();
serializer.domConfig.setParameter("format-pretty-print", true);
prettyxml= serializer.writeToString(document);

回复收藏 0 原文

魔法唧唧 2024-07-20 04:30:38

如果您不使用正则表达式，那么这样做会简单得多。事实上，我什至不确定正则表达式是否可行。

大多数语言都有 XML 库，可以使这项任务变得非常简单。您使用什么语言？

回复收藏 0 原文

我要还你自由 2024-07-20 04:30:38

我不知道正则表达式是否可以单独对任意 XML 输入执行漂亮的打印格式。您需要程序应用正则表达式来查找标记，找到匹配的结束标记（如果标记不是自闭合的），等等。使用正则表达式来解决这个问题实际上是使用了错误的工具。漂亮打印 XML 的最简单方法是使用 XML 解析器，读入它，设置适当的序列化选项，然后将 XML 序列化回来。

为什么要使用正则表达式来解决这个问题？

回复收藏 0 原文

_畞蕅 2024-07-20 04:30:38

为此使用正则表达式将是一场噩梦。根据节点的层次结构跟踪缩进级别几乎是不可能的。也许 perl 的 5.10 正则表达式引擎可能会有所帮助，因为它现在是可重入的。但我们不要走这条路...此外，您还需要考虑 CDATA 部分，它们可以嵌入需要被缩进忽略并完整保留的 XML 声明。

坚持使用 DOM。正如另一个答案中所建议的，一些库已经提供了一个可以为您缩进 DOM 树的函数。如果不构建一个将比创建和维护执行相同任务的正则表达式简单得多。

回复收藏 0 原文

無心 2024-07-20 04:30:38

这里描述的黑暗巫术正则表达式效果很好。
http://www.perlmonks.org/?node_id=261292
与使用 XML::LibXMl 和其他方法相比，它的主要优点是速度快一个数量级。

回复收藏 0 原文

℡Ms空城旧梦 2024-07-20 04:30:38

这只能通过多个正则表达式来实现，其执行方式类似于状态机。

您正在寻找的东西更适合即兴解析器。

回复收藏 0 原文

秋叶绚丽 2024-07-20 04:30:38

来自此链接：

  private static Regex indentingRegex=new Regex(@"\<\s*(?<tag>[\w\-]+)(\s+[\w\-]+\s*=\s*""[^""]*""|'[^']*')*\s*\>[^\<]*\<\s*/\s*\k<tag>\s*\>|\<[!\?]((?<=!)--((?!--\>).)*--\>|(""[^""]*""|'[^']'|[^>])*\>)|\<\s*(?<closing>/)?\s*[\w\-]+(\s+[\w\-]+\s*=\s*""[^""]*""|'[^']*')*\s*((/\s*)|(?<opening>))\>|[^\<]*", RegexOptions.ExplicitCapture|RegexOptions.Singleline);

  public static string IndentXml(string xml) {
        StringBuilder result=new StringBuilder(xml.Length*2);
        int indent=0;
        for (Match match=indentingRegex.Match(xml); match.Success; match=match.NextMatch()) {
              if (match.Groups["closing"].Success)
                    indent--;
              result.AppendFormat("{0}{1}\r\n", new String(' ', indent*2), match.Value);
              if (match.Groups["opening"].Success&&(!match.Groups["closing"].Success))
                    indent++;
        }
        return result.ToString();
  }

From this link:

  private static Regex indentingRegex=new Regex(@"\<\s*(?<tag>[\w\-]+)(\s+[\w\-]+\s*=\s*""[^""]*""|'[^']*')*\s*\>[^\<]*\<\s*/\s*\k<tag>\s*\>|\<[!\?]((?<=!)--((?!--\>).)*--\>|(""[^""]*""|'[^']'|[^>])*\>)|\<\s*(?<closing>/)?\s*[\w\-]+(\s+[\w\-]+\s*=\s*""[^""]*""|'[^']*')*\s*((/\s*)|(?<opening>))\>|[^\<]*", RegexOptions.ExplicitCapture|RegexOptions.Singleline);

  public static string IndentXml(string xml) {
        StringBuilder result=new StringBuilder(xml.Length*2);
        int indent=0;
        for (Match match=indentingRegex.Match(xml); match.Success; match=match.NextMatch()) {
              if (match.Groups["closing"].Success)
                    indent--;
              result.AppendFormat("{0}{1}\r\n", new String(' ', indent*2), match.Value);
              if (match.Groups["opening"].Success&&(!match.Groups["closing"].Success))
                    indent++;
        }
        return result.ToString();
  }

回复收藏 0 原文

~没有更多了~