Parsec 与 Yacc/Bison/Antlr：为什么以及何时使用 Parsec？

发布于 2024-10-18 09:02:17 字数 592 浏览 7 评论 0原文

我是 Haskell 和 Parsec 的新手。读完第16章使用现实世界Haskell的秒差距后，我的脑海中出现了一个问题：为什么以及何时 Parsec 比 Yacc/Bison/Antlr 等其他解析器生成器更好？

我的理解是 Parsec 创建了一个很好的 DSL 编写解析器，而 Haskell 让它变得非常简单和富有表现力。但解析是这样一种标准/流行的技术，值得拥有自己的语言，输出到多种目标语言。那么我们什么时候应该使用 Parsec 而不是从 Bison/Antlr 生成 Haskell 代码呢？

这个问题可能超出了技术范围，进入了行业实践领域。当从头开始编写解析器时，与 Bison/Antlr 或类似的东西相比，选择 Haskell/Parsec 有什么好处？

顺便说一句：我的问题与这个问题非常相似，但不是那里得到了满意的答复。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

纸短情长 2024-10-25 09:02:18

您可能想查看此问题以及问题中的链接问题。

哪种 Haskell 解析技术最好用，为什么？

在 Haskell 中，竞争发生在 Parsec（和其他解析器组合器）和解析器生成器 Happy 之间。如果我已经有一个 LR 语法可以使用，我会选择 Happy - 解析器组合器采用 LL 形式的语法，并且从 LR 到 LL 的翻译需要一些努力，并且组合器解析器通常会慢得多。如果我没有语法，我将使用 Parsec，它比 Happy 更灵活（更强大），并且“在 Haskell 中”工作比使用 Happy 和 Alex 生成代码更有趣。如果您使用 Happy 进行解析，您几乎总是需要使用 Alex 进行词法分析。

对于行业实践来说，决定使用 Haskell 只是为了获得秒差距是很奇怪的。对于解析，当前大多数语言都至少有一个解析器生成器，并且可能有一些更灵活的东西，例如 Parsec 端口或 PEG 系统。

Ira Baxter 对相关问题的回答非常准确，即解析器只需让您到达喜马拉雅山的立足点即可编写翻译器，但成为翻译器的一部分只是解析器的用途之一，所以仍然有很多领域像 ANTLR、Happy 和 Parsec 这样相当简约的系统是令人满意的。

回复收藏 0 原文

伪心 2024-10-25 09:02:18

根据斯蒂芬的回答，我认为如果您想坚持使用解析器组合器，秒差距最常见的替代方案之一是 attoparsec。主要区别在于 attoparsec 的编写更多地偏向于速度，并相应地进行了权衡。例如，Parsec 会进行一些记录，以便在解析失败时尝试返回有用的错误消息，而 attoparsec 则不会做到这一点。另外，我认为 attoparsec 专门用于一种输入流/令牌类型，而 Parsec 从输入类型中抽象出来，以便它可以毫无问题地解析 String、ByteString、Text 等类型的流。

回复收藏 0 原文

故事与诗 2024-10-25 09:02:17

您列出的工具之间的主要区别之一是 ANTLR、Bison 及其朋友是解析器生成器，而 Parsec 是解析器组合器库。

解析器生成器读取语法的描述并输出解析器。通常不可能将现有语法组合成新语法，并且当然不可能将两个现有生成的解析器组合成新解析器。

解析器组合器 OTOH 不执行任何操作，只是将现有解析器组合成新的解析器。通常，解析器组合器库附带几个简单的内置解析器，可以解析空字符串或单个字符，并且它附带一组组合器，它们采用 1 个或多个解析器并返回一个新的解析器，例如，解析原始解析器的序列（例如，您可以将 d 解析器和 o 解析器组合起来形成 do 解析器），交替原始解析器（例如 0 解析器和 1 解析器到 0|1 解析器）或多次解析原始解析器（重复）。

例如，这意味着您可以采用现有的 Java 解析器和现有的 HTML 解析器，并将它们组合成 JSP 解析器。

大多数解析器生成器不支持这一点，或者仅以有限的方式支持它。解析器组合器 OTOH 仅支持这一点，而不支持其他任何东西。