语言或库之间的正则表达式性能

发布于 2024-10-19 11:41:24 字数 246 浏览 8 评论 0原文

我找不到关于这个主题的任何内容，所以我想知道是否有人比较过不同语言之间正则表达式匹配的速度。我想知道哪种语言可以更快地进行正则表达式评估，因为在我当前的项目中，我需要不断评估大量的正则表达式。语言的选择将主要基于此性能。

我的想法是 C/C++ 自然会更快，但我想尽可能避免它，我不确定我是否正确。例如，C# 库可能将本机代码与 P/Invoke 一起使用，因此速度差异可能会很荒谬。但我不知道该选择哪个库，或者是否需要围绕 C++ 库创建一个包装器（哪个？）。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

つ低調成傷 2024-10-26 11:41:25

什么类型的正则表达式？他们会使用前瞻、后瞻、反向引用、勉强量词、原子组、所有格量词等功能吗？

其他响应者已链接到 regex-dna 基准，但它只使用所有正则表达式风格共享的最基本功能，例如 Kleene 星号 (*) 和交替 (|)。因此，虽然 GNU C/C++ 实现似乎是明显的赢家，但如果您需要我上面列出的任何功能，它们不会给您带来任何好处。

另一个考虑因素是 Unicode 支持。如果您处理的是实际文本（而不是表示为文本的数据，如 regex-dna 基准测试中的数据），则应使用具有良好 Unicode 支持的正则表达式风格。

我建议你研究一下 C#。 .NET 正则表达式风格并不以速度慢而闻名（在我看来，这是您可以说的关于正则表达式速度的唯一明智的事情），并且对于性能关键型应用程序，它提供了直接编译为字节代码以显着提高性能。

回复收藏 0 原文

失与倦＂ 2024-10-26 11:41:25

这里有一个正则表达式基准： http: //shootout.alioth.debian.org/u64q/benchmark.php?test=regexdna&lang=all&box=1

但是您将要使用的正则表达式类型可能比您的正则表达式更重要发动机的选择。对于某些类型，某些引擎比其他引擎做得更好，并且无论引擎是什么，某些类型的正则表达式都很慢（例如某些正则表达式可能需要指数时间）

回复收藏 0 原文

满地尘埃落定 2024-10-26 11:41:25

我建议在 RegExBuddy 中评估复杂的正则表达式。
尝试使用您想要测试的语言。它以毫秒为单位显示速度。相信我，这是一个很棒的工具。

回复收藏 0 原文

静待花开 2024-10-26 11:41:25

语言的选择将是
主要是基于这个性能。

那么您的选择可能取决于正则表达式引擎的选择。

您的程序会在单核机器还是多核机器上运行，还是x86 还是x64？

回复收藏 0 原文

~没有更多了~

关于作者

感性不性感

暂无简介

文章

26 人气

关注发私信

友情链接

文江博客

语言或库之间的正则表达式性能

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（4）

关于作者

相关话题

热门标签

推荐作者

alipaysp_snBf0MSZIv

梦断已成空

瞎闹

凯凯我们等你回来

寄意

似梦非梦

友情链接

语言或库之间的正则表达式性能

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（4）

关于作者

相关话题

热门标签

推荐作者

alipaysp_snBf0MSZIv

梦断已成空

瞎闹

凯凯我们等你回来

寄意

似梦非梦

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。