正则表达式捕获Python panda系列中的整个字符串

发布于 2025-01-11 15:32:43 字数 568 浏览 0 评论 0原文

我有一个示例系列：

s = pd.Series(['Complexity Level 1', 'RandomName', 'I-Invoice Submission test', 'I-test2', 'I-string with multiple words'])

我试图仅捕获以“I-”开头的字符串。使用提取。

extract1 = s.str.extract(r'I-(\w+)')

当前输出：

    0
0   NaN
1   NaN
2   Invoice
3   test2
4   string

当前仅提取第一个单词。但我想要标识符后面的所有单词和空格。最多可以有 5 个单词

这是正则表达式调整还是有更好的方法？

我想要的是：

    0
0   NaN
1   NaN
2   Invoice Submission test
3   test2
4   string with multiple words

原文

I have a sample series:

s = pd.Series(['Complexity Level 1', 'RandomName', 'I-Invoice Submission test', 'I-test2', 'I-string with multiple words'])

I'm trying to capture only strings that begin with "I-". Using extract.

extract1 = s.str.extract(r'I-(\w+)')

Current Output:

    0
0   NaN
1   NaN
2   Invoice
3   test2
4   string

It's currently only extracting the first word. But I want all words and white space after the identifier. This could be up to 5 words

Is this a regex adjustment or is there a better method?

What I want is:

    0
0   NaN
1   NaN
2   Invoice Submission test
3   test2
4   string with multiple words

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

有木有妳兜一样 2025-01-18 15:32:43

完成这项工作的正则表达式是r'I-(.*)'?。含义：捕获 "|-" 之后的任何字符（直到换行符）。

编辑（来自评论）：

要捕获逗号之前的任何字符，请使用I-([^,]*)。含义：捕获 "|-" 之后除逗号 (,) 之外的任何字符。

回复收藏 0 原文

~没有更多了~

关于作者

堇年纸鸢

暂无简介

文章

25 人气

关注发私信

卷耳

文章 0 评论 0

关注

佚名

文章 0 评论 0

关注

℉服软

文章 0 评论 0

关注

qq_2gSKZM

文章 0 评论 0

关注

凉宸

文章 0 评论 0

关注

gyhjy

文章 0 评论 0

友情链接

文江博客

正则表达式捕获Python panda系列中的整个字符串

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

卷耳

佚名

℉服软

qq_2gSKZM

凉宸

gyhjy

友情链接

正则表达式捕获Python panda系列中的整个字符串

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

卷耳

佚名

℉服软

qq_2gSKZM

凉宸

gyhjy

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。