编写编程语言解析器的最佳实践

发布于 2024-07-14 10:47:09 字数 26 浏览 6 评论 0原文

在编写解析器时我应该遵循哪些最佳实践？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

酒浓于脸红 2024-07-21 10:47:09

公认的智慧是使用解析器生成器+语法，这似乎是个好建议，因为您使用的是严格的工具，并且可能会减少这样做的工作量和潜在的错误。

要使用解析器生成器，语法必须与上下文无关。如果您正在设计要解析的语言，那么您可以控制它。如果你不确定，那么如果你开始学习语法路线，可能会花费你很多努力。即使它在实践中是上下文无关的，除非语法非常庞大，否则手动编写递归体面的解析器会更简单。

上下文无关不仅使解析器生成器成为可能，而且还使手工编码的解析器变得更加简单。您最终得到的是每个短语一个（或两个）功能。也就是说，如果您干净地组织和命名代码，并不比语法更难查看（如果您的 IDE 可以显示调用层次结构，那么您几乎可以看到语法是什么）。

优点： -

更简单的构建
更好的性能
更好的输出控制
可以应对小偏差，例如使用不是 100% 上下文无关的语法

我并不是说语法总是不合适，但通常好处很小，而且常常被忽视由成本和风险决定。

（我相信他们的论点似乎很有吸引力，并且对他们存在普遍偏见，因为这是一种表明一个人更有计算机科学素养的方式。）

回复收藏 0 原文

南薇 2024-07-21 10:47:09

几点建议：

了解语法 - 以合适的形式写下来
选择正确的工具。使用 Spirit2x 在 C++ 中执行此操作，或者选择外部解析器工具，如 antlr、yacc 或任何适合您的工具
您需要解析器吗？也许正则表达式就足够了？或者也许破解一个 perl 脚本来达到这个目的？编写复杂的解析器需要时间。

回复收藏 0 原文

段念尘 2024-07-21 10:47:09

不要过度使用正则表达式 - 虽然它们有其用处，但它们根本没有能力处理任何类型的真正解析。你可以推动它们，但你最终会碰壁或最终陷入无法维护的混乱。您最好找到一个可以处理更大语言集的解析器生成器。如果您真的不想使用工具，您可以查看递归下降解析器 - 这是手动编写小型解析器的非常简单的模式。它们不像大型解析器生成器那样灵活或强大，但它们的学习曲线要短得多。

除非您有非常严格的性能要求，否则请尝试将各个层分开 - 词法分析器读取各个标记，解析器将它们排列成树，然后语义分析检查所有内容并链接引用，然后是最后阶段输出任何内容正在制作中。将逻辑的不同部分分开将使以后更容易维护。

回复收藏 0 原文