从样本数据创建解析器语法

发布于 2024-12-11 09:10:16 字数 299 浏览 11 评论 0原文

我一直在四处寻找可以帮助用户创建语法的工具。有各种 IDE，但是......它们似乎是处理语法文件本身的文本编辑器。我正在寻找一种以数据为中心的方法。因此，假设我有很多想要用解析器解析的数据示例。因此，我想处理该示例数据并直接从中定义语法。

有没有现有的软件可以做类似的事情？

我将尝试更清楚地说明...

我提到的以数据为中心的方法是用户在数据样本中加载的位置。然后他们会选择其中的一些片段来表明它们是字段，或者选择项目并将它们标记为分隔符，等等。

与大多数 IDE 不同，我发现只有用于用语法语言本身编写的文本编辑器。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

在巴黎塔顶看东京樱花 2024-12-18 09:10:16

任何有限的字符串集合都构成了常规语言。编写接受这种语言的 NFA 是微不足道的。由此，您可以使用子集构造生成 DFA，并利用 DFA 对于不可区分关系的每个等价类只需要一个状态这一事实来最小化它。所以这是一个完全的算法过程......获取正则表达式和/或语法也同样简单。

话虽这么说，如果您想生成一个生成字符串以及可能其他字符串的语法......您的问题似乎不合适。对于任何有限的字符串集，无限多个语法会生成它们和其他字符串......数字的无限来自这样一个事实：只要您命中目标数据集，您就可以生成任何其他字符串。你的问题本质上是，“给定序列 a1, a2, ..., an, ... 的开头，说出接下来的 n 个元素是什么。”这是不可能做到的，除非您只是想要一些答案...在这种情况下，您始终可以从 DFA 开始并建议概括此问题的方法（即，仅接受更多字符串）。

事实上，给定例如常规语法，很容易引入新字符串......所以可以使用第一个答案作为起点。但请注意，从 NFA 到 DFA 的转换效率可能非常低......渐近指数。

回复收藏 0 原文