在 Python 的正则表达式中使用带有 unicode 的词尾标记

发布于 2024-09-06 09:44:31 字数 375 浏览 7 评论 0原文

以下内容在 Idle 中匹配,但在模块文件中的方法中运行时不匹配:

import re
re.search('\\bשלום\\b','שלום עולם',re.UNICODE)

而以下内容在两种情况下都匹配:(

import re
re.search('שלום','שלום עולם',re.UNICODE)

请注意,stackoverflow 错误地切换了上行中的第一项和第二项,因为这是从右到左语言)

如何使 py 文件中的第一个代码匹配?

更新:我应该为第一段编写的是它在 Idle 中匹配,但在 Eclipse 控制台中使用 PyDev 运行时不匹配。

The following matches in Idle, but does not match when run in a method in a module file:

import re
re.search('\\bשלום\\b','שלום עולם',re.UNICODE)

while the following matches in both cases:

import re
re.search('שלום','שלום עולם',re.UNICODE)

(Notice that stackoverflow erroneously switches the first and second items in the line above as this is a right to left language)

How can I make the first code match inside a py file?

Update: What I should have written for the first segment is that it matches in Idle, but does not match when run in eclipse console with PyDev.

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

薄暮涼年 2024-09-13 09:44:31

当我使用 unicode 字符串时似乎对我有用:

# -*- coding: utf-8 -*-

import re
match = re.search(u'\\bשלום\\b', u'שלום עולם', re.U)

查看实际操作: http://codepad.org/xWz5cZj5< /a>

Seems to work for me when I'm using unicode strings:

# -*- coding: utf-8 -*-

import re
match = re.search(u'\\bשלום\\b', u'שלום עולם', re.U)

See it in action: http://codepad.org/xWz5cZj5

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文