如何将西里尔字母与正则表达式匹配
如何将法语和俄语西里尔字母字符与正则表达式匹配?我只想处理字母字符,没有数字或特殊字符。现在我有
[A-Za-z]
How do I match French and Russian Cyrillic alphabet characters with a regular expression? I only want to do the alpha characters, no numbers or special characters. Right now I have
[A-Za-z]
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(11)
如果您的
regex
风格支持 Unicode 块 ([\p{IsCyrillic}]
),则可以匹配 西里尔字母 字符与:否则尝试使用:
对于
PHP
使用:解释:
注意:
[U+0400–U+04FF]
。If your
regex
flavor supports Unicode blocks ([\p{IsCyrillic}]
), you can match Cyrillic characters with:Otherwise try using:
For
PHP
use:Explanation:
Note:
Unicode Characters list and Numeric HTML Entities of
[U+0400–U+04FF]
.这取决于您的正则表达式风格。如果它支持 Unicode 字符类(例如 .NET),则
\p{L}
匹配字母字符(任何字符集中)。It depends on your regex flavor. If it supports Unicode character classes (like .NET, for instance),
\p{L}
matches a letter character (in any character set).要仅匹配俄语西里尔字母,请使用:
相当于:
其中
А
是西里尔字母,而不是拉丁字母。 (尽管看起来相同,但它们具有不同的代码)\p{IsCyrillic}
、\p{Cyrillic}
、[\u0400-\u04FF]
其他人建议将匹配西里尔字母的所有变体,而不仅仅是俄语To match only Russian Cyrillic characters use:
which is the equivalent of:
where
А
is Cyrillic, not Latin. (Despite looking the same they have different codes)\p{IsCyrillic}
,\p{Cyrillic}
,[\u0400-\u04FF]
which others suggested will match all variants of Cyrillic, not only Russian如果您使用现代 PHP 版本 - 只是:
不要忘记 unicode 支持的 u 标志!
If you use modern PHP version - just:
Don't forget the u flag for unicode support!
将西里尔字母与普通(英语)字母匹配的正则表达式:
它匹配特殊字符、西里尔字母、英语字母。
Regex to match cyrillic alphabets with normal(english) alphabets :
It matches special chars,cyrillic alphabets,english alphabets.
各种正则表达式方言使用
[:alpha:]
表示当前区域设置中的任何字母数字字符。 (您可能需要将其放入字符类中,例如[[:alpha:]]
。)Various regex dialects use
[:alpha:]
for any alphanumeric character in the current locale. (You may need to put that in a character class, e.g.[[:alpha:]]
.)这对我有用
this worked for me
您可以使用第一个和最后一个字母。例如保加利亚语:
You can use the first and the last letter. For example in Bulgarian:
如果您使用 Elixir:
您需要添加
u
标志以支持 unicode。If you use Elixir:
You need to add the
u
flag for unicode support.对于现代 PHP(来源):
For modern PHP (source):
在 Java 中,要匹配西里尔字母和空格,请使用以下模式
In Java to match Cyrillic letters and space use the following pattern