Java字符串搜索忽略重音符号

发布于 2024-08-24 04:29:06 字数 343 浏览 9 评论 0原文

我正在尝试为我的应用程序编写一个过滤函数，该函数将采用输入字符串并过滤掉以某种方式与给定输入不匹配的所有对象。最简单的方法是使用 String 的 contains 方法，即仅检查对象（对象中的 String 变量）是否包含过滤器中指定的字符串，但这不会考虑重音。

有问题的对象基本上是人，而我试图匹配的字符串是名称。例如，如果有人搜索 Joao，我希望 Joáo 包含在结果集中。我已经在我的应用程序中使用了 Collator 类来按名称排序，它运行良好，因为它可以进行比较，即使用 UK Locale á 在 b 之前但 a 之后。但显然，如果比较 a 和 á ，它不会返回 0，因为它们不相等。

那么有人知道我该如何做到这一点吗？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

初见 2024-08-31 04:29:06

使用 java.text.Normalizer和一些正则表达式来消除变音符号。

public static String removeDiacriticalMarks(String string) {
    return Normalizer.normalize(string, Form.NFD)
        .replaceAll("\\p{InCombiningDiacriticalMarks}+", "");
}

您可以按如下方式使用：

String value = "Joáo";
String comparisonMaterial = removeDiacriticalMarks(value); // Joao

Make use of java.text.Normalizer and a shot of regex to get rid of the diacritics.

public static String removeDiacriticalMarks(String string) {
    return Normalizer.normalize(string, Form.NFD)
        .replaceAll("\\p{InCombiningDiacriticalMarks}+", "");
}

Which you can use as follows:

String value = "Joáo";
String comparisonMaterial = removeDiacriticalMarks(value); // Joao

回复收藏 0 原文

≈。彩虹 2024-08-31 04:29:06

对于 a 和 á，Collator 确实返回 0，如果您将其配置为忽略变音符号：

public boolean isSame(String a, String b) {
    Collator insenstiveStringComparator = Collator.getInstance();
    insenstiveStringComparator.setStrength(Collator.PRIMARY);
    // Collator.PRIMARY also works, but is case senstive
    return insenstiveStringComparator.compare(a, b) == 0;
}

isSame("a", "á") 现在生成 true

Collator does return 0 for a and á, if you configure it to ignore diacritics:

public boolean isSame(String a, String b) {
    Collator insenstiveStringComparator = Collator.getInstance();
    insenstiveStringComparator.setStrength(Collator.PRIMARY);
    // Collator.PRIMARY also works, but is case senstive
    return insenstiveStringComparator.compare(a, b) == 0;
}

isSame("a", "á") yields true now

回复收藏 0 原文