在Python中将区分大小写的unicode字符串与正则表达式匹配

发布于 2024-12-04 09:58:51 字数 244 浏览 4 评论 0原文

假设我想匹配一个小写字母后跟一个大写字母，我可以做类似

re.compile(r"[a-z][A-Z]")

现在我想对 unicode 字符串做同样的事情，即匹配“aÅ”或“yÜ”之类的内容。

尝试过

re.compile(r"[a-z][A-Z]", re.UNICODE)

但不起作用。

有什么线索吗？

原文

Suppose I want to match a lowercase letter followed by an uppercase letter, I could do something like

re.compile(r"[a-z][A-Z]")

Now I want to do the same thing for unicode strings, i.e. match something like 'aÅ' or 'yÜ'.

Tried

re.compile(r"[a-z][A-Z]", re.UNICODE)

but that does not work.

Any clues?

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

不甘平庸 2024-12-11 09:58:51

这对于 Python 正则表达式来说很难做到，因为当前的实现不支持 Unicode 属性快捷方式，例如 \p{Lu} 和 \p{Ll}。

[A-Za-z] 当然只会匹配 ASCII 字母，无论是否设置了 Unicode 选项。

因此，直到更新 re 模块（或者安装 regex package当前正在开发中），您要么需要以编程方式执行此操作（遍历字符串并执行 char.islower()/char.isupper() 字符上），或指定所有 unicode手动代码点这可能不值得付出努力......

回复收藏 0 原文

~没有更多了~

关于作者

樱桃奶球

暂无简介

文章

26 人气

关注发私信

知足的幸福

文章 0 评论 0

关注

我一向站在原地

文章 0 评论 0

关注

慕烟庭风

文章 0 评论 0

关注

秉忠贞之诚守退让之实

文章 0 评论 0

关注

小兔几

文章 0 评论 0

关注

mb_3y7WUgWY

文章 0 评论 0

友情链接

文江博客

在Python中将区分大小写的unicode字符串与正则表达式匹配

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

知足的幸福

我一向站在原地

慕烟庭风

秉忠贞之诚守退让之实

小兔几

mb_3y7WUgWY

友情链接

在Python中将区分大小写的unicode字符串与正则表达式匹配

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

知足的幸福

我一向站在原地

慕烟庭风

秉忠贞之诚 守退让之实

小兔几

mb_3y7WUgWY

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

秉忠贞之诚守退让之实