当前位置：文江博客话题详情

RegEx 或 Pygrok 模式匹配

发布于 01-10 11:45 字数 210 浏览 5 评论 0原文

我有这样的文本

示例： “签证代码：ab c主号码：efg发现：ij k”

输出应如下所示： abc, efg, ijk

有没有办法，我可以使用 Grok 模式匹配或 Reg EX 来获取“：”后的 3 个字符（不考虑空格）？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

老街孤人2025-01-17 11:45:27

你可以从这个开始：

>>> import re
>>> p = re.compile(r"\b((?:\w\s*){2}\w)\b")
>>> re.findall(p, "visa code: ab c master number: efg discover: i j k")
['ab c', 'efg', 'i j k']

但是你还有更多的工作要做。例如，没有人能准确地猜出你所说的“字符”是什么意思。

除此之外，模式匹配系统匹配字符串，但不转换它们。您必须通过其他方式删除不需要的空格（这应该很容易）。

You can start with this:

>>> import re
>>> p = re.compile(r"\b((?:\w\s*){2}\w)\b")
>>> re.findall(p, "visa code: ab c master number: efg discover: i j k")
['ab c', 'efg', 'i j k']

But you have more work to do. For example, nobody can guess what you mean - exactly - by "characters".

Beyond that, pattern matching systems match strings, but do not convert them. You'll have to remove spaces you don't want via some other means (which should be easy).

回复收藏 0 原文

~没有更多了~