当前位置：文江博客话题详情

生成与某些输入集匹配的正则表达式是一个可解决的问题吗？

发布于 2024-10-08 18:21:19 字数 221 浏览 4 评论 0原文

我提供了一些输入集，其中包含已知的分隔数量的文本块。

我想制作一个程序，自动生成 1 个或多个正则表达式，每个正则表达式与输入集中的每个文本块匹配。

我看到了一些相对简单的方法来实现强力搜索。但我不是编译器理论方面的专家。这就是为什么我很好奇：

1）这个问题可以解决吗？或者有一些原则上不可能做出这样的算法？

2）该算法是否可以实现多项式复杂度并避免暴力破解？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

夜夜流光相皎洁 2024-10-15 18:21:22

http://txt2re.com/ 可能就是您想要的。

回复收藏 0 原文

仙女山的月亮 2024-10-15 18:21:21

“.*”是一个或多个正则表达式，它将匹配输入集中的每个文本块。 ;-)

回复收藏 0 原文

天涯离梦残月幽梦 2024-10-15 18:21:21

问题是，有大量的正则表达式（实际上是无限多个）将匹配给定的一组输入。它们的范围从非常“贪婪”的表达式（将匹配所有内容）

.*

到非常非“贪婪”的表达式（将与输入集完全匹配）

InputA OR inputB OR inputC etc

在这两者之间，您可以通过多种方式改变表达式以使其变得更加贪婪或不那么贪婪（例如，用匹配任何数字的表达式替换特定数字等）。

您必须告诉我们更多有关该问题的信息，以便我们知道在这一系列可能的答案中哪些是正确的答案；）

The problem is, there are a huge number of regular expressions (actually, an infinite number) that will match a given set of inputs. They range from very "greedy" expressions that will match everything

.*

To very non "greedy" expression that will match exactly the input set

InputA OR inputB OR inputC etc

In between those two you can vary the expression in a variety of ways to make it more and less greedy (eg, replace specific digits with an expression which matches any digit, etc).

You'll have to tell us a little more about the problem for us to know where in that range of possible answers is the correct one ;)

回复收藏 0 原文