需要:开源 C/C++执行unicode的正则表达式库
我正在寻找一个优秀的开源 C/C++ 正则表达式库,它具有完整的 Unicode 支持。
我在库可能获取 ASCII、UTF-8 或 UTF-16 的环境中使用它。如果它得到 UTF-16,它可能有也可能没有必要的引用字符 (FF FE) 或 (FE FF)。
我环顾四周,除了 PCRE 之外似乎没有其他选择。
我的第二个问题是我目前正在使用 flex 来构建一些巨大的正则表达式。理想情况下,我会有一个类似 Flex 的词汇表达式生成器,它也可以处理 Unicode。
有什么建议吗?
I'm looking for a good open source C/C++ regular expression library that has full Unicode support.
I'm using this in an environment where the library might get ASCII, UTF-8, or UTF-16. If it gets UTF-16 it might or might not have the necessary quoting characters (FF FE) or (FE FF).
I've looked around and there don't seem to be any options other than PCRE.
My second problem is that I'm currently using flex to build some HUGE regular expressions. Ideally I would have a flex-like lexical expression generator that also handles Unicode.
Any suggestions?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(2)
您是否考虑过ICU?
它具有成熟的正则表达式支持。
Have you considered ICU?
It has mature regular expression support.
我相信Boost Spirit和Boost Regex 都至少有一定程度的 Unicode 支持。
I believe Boost Spirit and Boost Regex both have at least some degree of Unicode support.