正则表达式匹配 1 2 3 4,5,6

发布于 2024-12-05 03:11:37 字数 460 浏览 0 评论 0原文

我有一个文件,其行格式如下:

1 2 3 4,5,6

前三行由空格分隔,后三行由逗号分隔。作为示例,我给出了 1-6,但这些值可以是字母数字值。有人可以帮我用正则表达式来匹配整行以提取 6 个值吗?

在Java中,我可以使用这个正则表达式 - line.split("[ ,]") 并且它可以工作,但是我使用的是 Hadoop Pig,我需要将正则表达式传递给一个名为 PigStorage() 的方法,该方法期望正则表达式与整个字符串。

这是 Pig 的文档

- “Pig 确实支持通过 matches 关键字进行正则表达式匹配。它使用 java.util.regex 匹配,这意味着您的模式必须匹配整个字符串(例如,如果您的字符串是“hi fred”并且您想要要找到“fred”,您必须给出“.*fred”模式,而不是“fred”)。

所以我想要一个正则表达式来匹配整行,并提取 6 个值。有什么帮助吗?

I have a file with lines in the following format

1 2 3 4,5,6

First three delimited by space and the last three delimited by commas. As an example i've given 1-6 but the values can be alphanumeric value. Can someone help me with a regular expression to match the entire line to extract the 6 values?

In Java i can use this regex - line.split("[ ,]") and it works, but I am using Hadoop Pig and I need to pass the regex to a method called PigStorage(), which expects the regex to match the entire string.

Here is the doc from Pig-

"Pig does support regular expression matching via the matches keyword. It uses java.util.regex matches which means your pattern has to match the entire string (e.g. if your string is "hi fred" and you want to find "fred" you have to give a pattern of ".*fred" not "fred")."

So I want a regex to match the entire line, and extract the 6 values. Any help?

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(4

給妳壹絲溫柔 2024-12-12 03:11:37

也许您需要在这里使用捕获组:

    Pattern p=Pattern.compile("(\\d)\\s(\\d)\\s(\\d)\\s(\\d),(\\d),(\\d)");
    Matcher m=p.matcher("1 2 3 4,5,6");
    int cnt=m.groupCount();
    for(int i=1;i<=cnt;++i)
    System.out.println(m.group(i));

Maybe you need use capture group here:

    Pattern p=Pattern.compile("(\\d)\\s(\\d)\\s(\\d)\\s(\\d),(\\d),(\\d)");
    Matcher m=p.matcher("1 2 3 4,5,6");
    int cnt=m.groupCount();
    for(int i=1;i<=cnt;++i)
    System.out.println(m.group(i));
枕头说它不想醒 2024-12-12 03:11:37
(\w+) (\w+) (\w+) (\w+),(\w+),(\w+)

或许?

(\w+) (\w+) (\w+) (\w+),(\w+),(\w+)

maybe?

会傲 2024-12-12 03:11:37

试试这个:

([^ ]+){4}([^,]+){2}

Try this one:

([^ ]+){4}([^,]+){2}
勿忘初心 2024-12-12 03:11:37

怎么样:

\S+ \S+ \S+ \S+,\S+,\S+

How about:

\S+ \S+ \S+ \S+,\S+,\S+
~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文