如何更改解析器的内部字符类型？

发布于 2024-08-15 17:16:06 字数 592 浏览 4 评论 0原文

我已经使用spirit classic有一段时间了，最近开始学习 v2。两者都易于使用且功能强大，足以处理中等解析问题。

在那些有精神经典和ascii字符的田园日子里，这项工作只是将 EBNF 调整为 LL 形式。但最后，我必须处理 i18n。

我的想法实在是太粗俗了。制作一个迭代的前向迭代器任何编码的输入文本字节流。迭代器处理这些编码转换工作并向解析器提供 utf16/32 代码单元（迭代器可以通过 iconv 或 icu4c 轻松实现）。

代码单元的类型应该是解析器处理的内部char类型。但读完文档后，我只能找到几个原始迭代器模板有一个显式的 char_t 参数。做这意味着我必须重新表述那些数字、指令、扫描仪和 ETC。？

我还查看了 v2 文档。它提供了一种命名空间方式一切都是一致的，但仍然没有太多关于如何明确地更改内部字符类型。我再次搜索了邮件列表存档，但似乎那些 unicode 和其他编码相关的帖子是仍然悬而未决。有人告诉我精神仍然有效通过那些具有不同编码的文件。所以我测试了解析器使用不同编码但内容相同的文件。多个MBCS 编码的文件通过了测试，随便一些utf8文件也通过了。但其他编码大多数时候都会失败。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

甜点 2024-08-22 17:16:06

我怀疑您已经找到 char_
和字符编码命名空间，来自 Boost Spirit 网站。

最后一页包含有用的注释

“我们为 Spirit 将支持的每个字符集都有一个命名空间。其中包括 ascii、iso8859_1、standard 和 standard_wide（以及将来的 unicode）。”

换句话说，boostspirit 目前并不真正支持 unicode。它在他们的待办事项清单上。

同时，您可以尝试像这样的笨拙解决方法：

my_tag_ = lit("<") >> byte_ >> lit(">");

它将匹配恰好出现在尖括号之间的任何二进制字符串，前提是您不使用任何与字符集相关的过滤器。

I suspect you have already found char_
and character encoding namespace from the Boost Spirit web site.

The last page includes the helpful comment

"We have a namespace for each character set Spirit will be supporting. That includes ascii, iso8859_1, standard and standard_wide (and in the future, unicode)."

In other words boost spirit doesn't really support unicode at the moment. It's on their TODO list.

In the mean time you could try a kludgy workaround like this:

my_tag_ = lit("<") >> byte_ >> lit(">");

which will match any binary string which happens to appear between angle brackets, providing you don't use any charset dependant filter on it.

回复收藏 0 原文

~没有更多了~

关于作者

此刻的回忆

暂无简介

0 文章

0 评论

22 人气

关注发私信

友情链接

文江博客

如何更改解析器的内部字符类型？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

不再见

真是无聊啊

樱娆

浅语花开

烛光

绻影浮沉

友情链接

如何更改解析器的内部字符类型？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

不再见

真是无聊啊

樱娆

浅语花开

烛光

绻影浮沉

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。