当前位置：文江博客话题详情

是否有任何免费的解析器生成器可以生成 C++正确编码和处理 Unicode？

发布于 2024-10-05 10:09:10 字数 434 浏览 3 评论 0原文

在问这个问题后，我现在我开始尝试使用解析器生成器，之前我要手动编写东西。

然而，我似乎找不到任何这样的生成 C++ 代码的解析器，也找不到正确处理 Unicode 的解析器。（请注意，我的输入是 UCS-2 中的——我不关心支持基本多语言平面之外的位，如果这会使构建解析器变得更加困难）

有一些解析器可以生成 C，但这些解析器似乎都将异常安全抛出窗外，这将阻止我在任何语义操作中使用 C++。

是否存在满足这两个原则的解析器生成器，或者我是否坚持手工完成所有事情？

编辑：哦，我的项目是 BSL 许可的，所以对解析器生成器本身的输出的使用不会有太多限制。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

一杯敬自由 2024-10-12 10:09:10

C++中有两种方式。使用一个程序，根据以自由形式或使用模板编写的语法生成 C++ 文件。

当你用模板类型编写语法时，你有两种选择。使用 boost::proto，其中每个运算符都被重新定义以在 boost::fusion 中构建语法树（用于 boost::spirit、boost::msm、boost::xpressive）。（基本思想在这里：表达式模板）或借助自己的模板手动构建表达式树并将其直接存储在 boost::mpl 容器中。该技术用于饼干。

在饼干中你有

or_<>, seq_<>, char_<>, ..

模板。 Biscuit 基于 Yard，但扩展了 boost::range 以获得更好的子匹配能力。

Biscuit 解析器库 1

Biscuit 解析器库 2

又一个 C++ 递归下降 (YARD) 解析框架

There are two way in C++. Using a program, that genereates C++ files from a grammar that is written in a free form or using templates.

And you have two choice when you writing a grammar in template types. Using the boost::proto, where every operator is redefinied to build a syntax tree in boost::fusion (used in boost::spirit, boost::msm, boost::xpressive). (basic idea is here:Expression Templates) or building an expression tree written by hand with the help of own templates and store it directly boost::mpl containers. This thecnique is used in biscuit.

In biscuit you have

or_<>, seq_<>, char_<>, ..

templates. Biscuit is based on Yard, but extended with an extended boost::range to get a better submatch capabaility.

The Biscuit Parser Library 1

The Biscuit Parser Library 2

Yet Another Recursive Descent (YARD) parsing framework for C++

回复收藏 0 原文

定格我的天空 2024-10-12 10:09:10

好吧，这可能是一个远景，但有一个解析器生成器（LALR）作为 Qt 的一个副项目，它被称为 QLALR 这是一个非常薄的层，词法分析仍然取决于你，但所有工作都可以通过支持 unicode 的 QString 来完成。它没有太多的功能，您使用为每个标记执行工作的代码编写语法，它将为您生成解析器。但我已经使用它成功生成了一个具有约 100 条规则的解析器，创建了所解析语言的 AST。

回复收藏 0 原文