当前位置：文江博客话题详情

ColdFusion 8 中西班牙语字母的正则表达式

发布于 2024-07-29 14:05:21 字数 105 浏览 6 评论 0原文

我知道我可以使用 [az] 来检查 CF 8 中从 a 到 z 的任何字母。但是，是否有任何正则表达式可以检测西班牙语字母，如 á、í、ó、é、ñ 等？

提前致谢，蒙特

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

叫思念不要吵 2024-08-05 14:05:21

ColdFusion 不能很好地处理 Unicode 正则表达式。
您可以使用诸如 #Chr(375)# 之类的方法将字符放入正则表达式字符串中，但这样做有点混乱。

然而，Java 确实可以使用 Unicode，并且由于 CF 可以轻松地利用 Java，因此您可以使用 Java 正则表达式来进行 unicode 匹配。

这将匹配 Java 正则表达式中的单个 Unicode 字母：

\p{L}

有关正则表达式 Unicode 的更多详细信息，请参见：http:// /www.regular-expressions.info/unicode.html

至于在 CF 中使用 Java 正则表达式，简单的替换就是这样：

<cfset NewString = OldString.replaceAll('\p{L}','ReplaceWith') />

所以如果您需要的只是替换字符串，您可以这样做。

但是，如果您想要匹配（相当于重新匹配）或更复杂的功能，那么最简单的解决方案是使用一个组件，将 Java 正则表达式功能包装到易于使用的 CFC 中，并带有您可以调用的常规 CFML 函数。就像 jre-utils.cfc

这允许您执行

<cfset jre = createObject('component','jre-utils').init() />

<cfset Matches = jre.match( '\p{L}++' , String ) />

以下操作：这将返回字符串中 (Unicode) 单词的数组。

ColdFusion doesn't nicely deal with Unicode regex.
You can use things like #Chr(375)# to get the characters into a regex string, but it's a bit messy having to do that.

However, Java does work with Unicode, and since CF can utilise Java easily, you can use Java regexes to do unicode matching.

This will match a single Unicode letter in Java regex:

\p{L}

With more details on regex Unicode here: http://www.regular-expressions.info/unicode.html

And as for using Java regex in CF, well simple replacing is just this:

<cfset NewString = OldString.replaceAll('\p{L}','ReplaceWith') />

So if all you need is to replace strings, you can do that.

However, if you want matching (equivalent to rematch), or more complex functionality, then simplest solution is to use a component that wraps the Java regex functionality into a easy to use CFC with regular CFML functions you can call. Like jre-utils.cfc

This allows you to do:

<cfset jre = createObject('component','jre-utils').init() />

<cfset Matches = jre.match( '\p{L}++' , String ) />

Which will return an array of the (Unicode) words in the string.

回复收藏 0 原文

蓝梦月影 2024-08-05 14:05:21

最近这里有一个关于国际正则表达式的讨论，但我现在找不到。我相信目前的情况是，正则表达式通常只能使用默认的拉丁字母。

回复收藏 0 原文

も星光 2024-08-05 14:05:21

尝试一下特殊的“单词字符类”\w 是否适合您。注意：这也会匹配数字。也许你可以用一个例子来澄清你到底想要完成什么？

\w 应匹配 a、ä 或 á（也可匹配 0）。

\w(? 将匹配 a、ä 或 á （但不匹配 a、ä 或 á） >0）。

\w+ 将匹配 börk，但也匹配 l33t。

\b(?:\w(? 将匹配 börk，但不匹配 l33t。

回复收藏 0 原文

~没有更多了~

关于作者

晨与橙与城

暂无简介

0 文章

0 评论

23 人气

关注发私信

友情链接

文江博客

ColdFusion 8 中西班牙语字母的正则表达式

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（3）

关于作者

相关话题

热门标签

推荐作者

留蓝

18790681156

zach7772

Wini

ayeshaaroy

初雪

友情链接

ColdFusion 8 中西班牙语字母的正则表达式

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（3）

关于作者

相关话题

热门标签

推荐作者

留蓝

18790681156

zach7772

Wini

ayeshaaroy

初雪

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。