在 Python 的正则表达式中使用带有 unicode 的词尾标记

发布于 2024-09-06 09:44:31 字数 375 浏览 7 评论 0原文

以下内容在 Idle 中匹配，但在模块文件中的方法中运行时不匹配：

import re
re.search('\\bשלום\\b','שלום עולם',re.UNICODE)

而以下内容在两种情况下都匹配：（

import re
re.search('שלום','שלום עולם',re.UNICODE)

请注意，stackoverflow 错误地切换了上行中的第一项和第二项，因为这是从右到左语言）

如何使 py 文件中的第一个代码匹配？

更新：我应该为第一段编写的是它在 Idle 中匹配，但在 Eclipse 控制台中使用 PyDev 运行时不匹配。

原文

The following matches in Idle, but does not match when run in a method in a module file:

import re
re.search('\\bשלום\\b','שלום עולם',re.UNICODE)

while the following matches in both cases:

import re
re.search('שלום','שלום עולם',re.UNICODE)

(Notice that stackoverflow erroneously switches the first and second items in the line above as this is a right to left language)

How can I make the first code match inside a py file?

Update: What I should have written for the first segment is that it matches in Idle, but does not match when run in eclipse console with PyDev.

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

薄暮涼年 2024-09-13 09:44:31

当我使用 unicode 字符串时似乎对我有用：

# -*- coding: utf-8 -*-

import re
match = re.search(u'\\bשלום\\b', u'שלום עולם', re.U)

查看实际操作： http://codepad.org/xWz5cZj5< /a>

Seems to work for me when I'm using unicode strings:

# -*- coding: utf-8 -*-

import re
match = re.search(u'\\bשלום\\b', u'שלום עולם', re.U)

See it in action: http://codepad.org/xWz5cZj5

回复收藏 0 原文

~没有更多了~

关于作者

┼──

暂无简介

0 文章

0 评论

24 人气

关注发私信

離殇

文章 0 评论 0

关注

小姐丶请自重

文章 0 评论 0

关注

Aik

文章 0 评论 0

关注

国产ˉ祖宗

文章 0 评论 0

关注

猥琐帝

文章 0 评论 0

关注

半仙

文章 0 评论 0

友情链接

文江博客

在 Python 的正则表达式中使用带有 unicode 的词尾标记

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

離殇

小姐丶请自重

Aik

国产ˉ祖宗

猥琐帝

半仙

友情链接

在 Python 的正则表达式中使用带有 unicode 的词尾标记

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

離殇

小姐丶请自重

Aik

国产ˉ祖宗

猥琐帝

半仙

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。