Perl 正则表达式中的未绑定变量
我有一堆像这样的行:
John Smith
Jane Doe
Dr. Bruce Wayne
我想将名称放入包含两列的 csv 文件中:标题和全名。 我为此使用正则表达式:/(\w*\.)?(.*)/
,然后打印"$1;$2"
。问题在于,在没有标题的名称中,perl 会抱怨未初始化的值 $1。如何让它只使用空字符串?
I have a bunch of lines like these:
John Smith
Jane Doe
Dr. Bruce Wayne
and I would like to put the names into a csv file with two columns: title and full name.
I'm using the regex for this: /(\w*\. )?(.*)/
, then I print "$1;$2"
. The problem is that in names without a title, perl complains about an uninitialized value $1. How do I make it just use an empty string?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(3)
只需将您的正则表达式更改为:
Just change your regex to :
一般来说,如果需要,要使匹配的一部分成为可选,您可以在
(?: )
组上使用 ?, 。只是使用?如果省略,捕获组将保留该捕获变量 undef,但您可以在捕获组内使用非捕获组:In general to make part of a match optional you use ?, on a
(?: )
group if necessary. Just using ? after a capturing group will leave that capture variable undef if omitted, but you can use a non-capturing group inside the capturing group:要以其他方式解决该问题,Lingua-EN-NameParse 可能会有所帮助。
To address the problem in another way, Lingua-EN-NameParse might help.