正则表达式匹配 1 2 3 4,5,6
我有一个文件,其行格式如下:
1 2 3 4,5,6
前三行由空格分隔,后三行由逗号分隔。作为示例,我给出了 1-6,但这些值可以是字母数字值。有人可以帮我用正则表达式来匹配整行以提取 6 个值吗?
在Java中,我可以使用这个正则表达式 - line.split("[ ,]") 并且它可以工作,但是我使用的是 Hadoop Pig,我需要将正则表达式传递给一个名为 PigStorage() 的方法,该方法期望正则表达式与整个字符串。
这是 Pig 的文档
- “Pig 确实支持通过 matches 关键字进行正则表达式匹配。它使用 java.util.regex 匹配,这意味着您的模式必须匹配整个字符串(例如,如果您的字符串是“hi fred”并且您想要要找到“fred”,您必须给出“.*fred”模式,而不是“fred”)。
所以我想要一个正则表达式来匹配整行,并提取 6 个值。有什么帮助吗?
I have a file with lines in the following format
1 2 3 4,5,6
First three delimited by space and the last three delimited by commas. As an example i've given 1-6 but the values can be alphanumeric value. Can someone help me with a regular expression to match the entire line to extract the 6 values?
In Java i can use this regex - line.split("[ ,]") and it works, but I am using Hadoop Pig and I need to pass the regex to a method called PigStorage(), which expects the regex to match the entire string.
Here is the doc from Pig-
"Pig does support regular expression matching via the matches keyword. It uses java.util.regex matches which means your pattern has to match the entire string (e.g. if your string is "hi fred" and you want to find "fred" you have to give a pattern of ".*fred" not "fred")."
So I want a regex to match the entire line, and extract the 6 values. Any help?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(4)
也许您需要在这里使用捕获组:
Maybe you need use capture group here:
或许?
maybe?
试试这个:
Try this one:
怎么样:
How about: