使用 java 从字符串中查找 mathml
我有一个大字符串,其中包含多个 mathml。想把一个字符串数组中的全部取出来。使用正则表达式来查找它们。但正则表达式中缺少某些内容,因此它不会提供任何输出。
MathMls 的正则表达式是什么?
示例字符串
求和 «math xmlns=\"http://www.w3.org/1998/Math/MathML\"»«mroot»«mrow»«mi»#«/mi »《mi》a《/mi》《/mrow》《mn》3《/mn》《/mroot》《mo》=《/mo》《mroot》《mrow》《mi》#《/mi》《mi》 b《/mi》《/mrow》《mn》3《/mn》《/mroot》《/math》和 «数学 xmlns=\"http://www.w3.org/1998 /Math/MathML\"»«mo»=«/mo»«msup»«mfenced»«mrow»«mi»#«/mi»«mi»b«/mi»«/mrow»«/mfenced»«mfrac »《mn》1《/mn》《mn》3《/mn》《/mfrac》《/msup》《/数学》
由此得到 2 个 mathml
I have a Big string which has multiple mathmls in it. Want to take out all of them in a string array. Using regex to find them. But something missing in the regex so it doesn't gives any output.
What is the regex for MathMls?
Example string
Find sum of «math xmlns=\"http://www.w3.org/1998/Math/MathML\"»«mroot»«mrow»«mi»#«/mi»«mi»a«/mi»«/mrow»«mn»3«/mn»«/mroot»«mo»=«/mo»«mroot»«mrow»«mi»#«/mi»«mi»b«/mi»«/mrow»«mn»3«/mn»«/mroot»«/math» and «math xmlns=\"http://www.w3.org/1998/Math/MathML\"»«mo»=«/mo»«msup»«mfenced»«mrow»«mi»#«/mi»«mi»b«/mi»«/mrow»«/mfenced»«mfrac»«mn»1«/mn»«mn»3«/mn»«/mfrac»«/msup»«/math»
From this get 2 mathmls
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
您不能使用 Java 的正则表达式引擎来做到这一点,因为这是有效的输入:
即:可以有任意嵌套标签,并且 Java 的正则表达式引擎无法匹配递归模式。您将不得不求助于一些解析器来处理 MathML 输入。
编辑
在这种情况下,请尝试此模式:
或作为字符串文字:
这意味着:
You can't do that with Java's regex engine since this is valid input:
i.e.: there can be arbitrary nested tags and Java's regex engine has no ability to match recursive patterns. You will have to resort to some parser to handle MathML input.
EDIT
In that case, try this pattern:
or as a String literal:
which means: