character-properties

character-properties

文章 0 浏览 6

如何在 javascript 的正则表达式中使用 unicode 字符组?

有没有一种方法可以在 javascript 中使用像“\p{L}”这样的模式? (我想这是一个与 perl 兼容的语法) 我首先对 firefox 支持和 webkit 感兴趣,可能…

只为守护你 2024-12-27 23:59:41 2 0

Perl 脚本停止。错误:找不到 unicode 属性定义 ASCII

我继承了一些 perl 脚本。 (我不是 Perl 程序员)。 我在下面一行中看到错误 “找不到 unicode 属性定义 ascii” $value =~ s/[^[:\p{ascii}]]//g 此…

半透明的墙 2024-12-27 23:26:49 1 0

如何找出 UTF 8 中标点符号的形式?

我有一组字符,例如 .、!、?、;、 (空格) 和一个字符串,该字符串可能是也可能不是 UTF 8(任何语言)。 有没有一种简单的方法可以找出字符串是否具…

谁许谁一生繁华 2024-12-08 10:48:48 3 0

在Python中将区分大小写的unicode字符串与正则表达式匹配

假设我想匹配一个小写字母后跟一个大写字母,我可以做类似 re.compile(r"[a-z][A-Z]") 现在我想对 unicode 字符串做同样的事情,即匹配“aÅ”或“yÜ”…

樱桃奶球 2024-12-04 09:58:51 4 0

清洗受污染的数据

当我清洗受污染的数据并检查它是否有任何坏字符时,是否有 unicode 属性可以过滤坏字符?…

国粹 2024-12-02 11:35:28 3 0

正则表达式:我需要将值请求参数与 unicode 字符匹配,但它不应该允许空格

JAVA 的正则表达式:我需要将请求参数的值与 unicode 字符相匹配,但它不应该允许空格。 基本上是一个正则表达式,应该允许所有没有空格的unicode字符…

ら栖息 2024-12-01 13:11:31 3 0

使用正则表达式检查特定字符串

我有一个任意长度的字符串类型列表,我需要确保列表中的每个字符串元素都是字母数字或数字,没有空格和特殊字符,例如 - \ / _ 等。 可接受的字符串示…

听风吹 2024-12-01 02:21:44 4 0

使用 \d 扫描字符串中的 Unicode 数字

根据 Oniguruma 文档,\d 字符类型匹配: 十进制数字字符 Unicode:General_Category -- Decimal_Number 但是,在包含所有 Decimal_Number 字符的字符…

演出会有结束 2024-11-28 13:40:38 4 0

Java 正则表达式中的 POSIX 字符等效项

我想在 Java 中使用这样的正则表达式:[[=a=][=e=][=i=]]。 但是 Java 不支持 POSIX 类[=a=]、[=e=] 等。 我该怎么做?更准确地说,有没有办法不使用 …

〗斷ホ乔殘χμё〖 2024-11-19 07:40:26 6 0

匹配任何 unicode 字母吗?

在.net中你可以使用\p{L}来匹配任何字母,我如何在Python中做同样的事情?也就是说,我想匹配任何大写、小写和重音字母。…

萧瑟寒风 2024-11-15 08:11:18 5 0

有没有办法匹配任意 Unicode 字母字符?

我有一些文档经过 OCR 从 PDF 转换为 HTML。因此,他们最终会出现很多随机的 unicode 标点符号,而转换器会搞砸(即省略号等)。他们也正确地有一堆非…

迷荒 2024-11-07 10:55:10 7 0

什么是 {L} Unicode 类别?

我遇到了一些包含 [^\\p{L}] 的正则表达式。我知道这是使用某种形式的 Unicode 类别,但是当我检查 在文档中,我只找到了以下“L”类别: Lu Uppercas…

扮仙女 2024-11-06 18:32:54 6 0

具有特殊字符的名称的正则表达式 (Unicode)

好吧,我已经读了一整天有关正则表达式的内容,但仍然没有正确理解它。我想做的是验证名称,但我在互联网上可以找到的函数仅使用 [a-zA-Z],而忽略了…

混吃等死 2024-11-06 14:34:15 5 0

在 Ruby 中枚举字符的 Unicode 属性?

有什么方法可以枚举 Ruby 中字符的所有 Unicode 属性吗?我可以使用 Ruby 1.9 的 Regexp 类来测试给定字符是否具有特定属性(例如,some_char =~ /\p{…

‖放下 2024-11-04 00:00:23 7 0

Javascript unicode(希腊语)正则表达式

我想在希腊文本中使用此正则表达式 new RegExp("\b"+pat+"\b") ,但“\b”元字符仅支持 ASCII 字符。 我尝试了 XregExp 库,但我没能解决这个问题。 …

∝单色的世界 2024-10-31 21:06:09 9 0
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文