当前位置：文江博客话题详情

在 Android SQLite 中使用 COLLATE - LIKE 语句中忽略区域设置

发布于 2024-09-14 03:45:42 字数 465 浏览 13 评论 0 原文

在 Android 中创建 SQLite 数据库时，我设置了数据库区域设置 - db.setLocale(new Locale("cz_CZ"))。这是捷克的语言环境。

SELECT 语句起作用并考虑区域设置，例如：

SELECT * from table WHERE name='sctzy' COLLATE LOCALIZED

将找到条目“ščťžý”。

但使用 LIKE 将失败：

SELECT * from table WHERE name LIKE '%sctzy%' COLLATE LOCALIZED

不会返回任何行。

顺便提一句。 Android 中没有 java.text.Normalized 类。我想我可以用规范化的文本创建第二列，去掉特殊字符，这将用于搜索 - 但我缺少一个如何规范化字符串的类或方法。

原文

When creating my SQLite database in Android I set the database locale - db.setLocale(new Locale("cz_CZ")). This is a Czech locale.

A SELECT statement works and takes the locale into account, for example:

SELECT * from table WHERE name='sctzy' COLLATE LOCALIZED

Will find the entry 'ščťžý'.

But using LIKE will fail:

SELECT * from table WHERE name LIKE '%sctzy%' COLLATE LOCALIZED

No row is returned.

BTW. There is no java.text.Normalized class in Android. I thought I could make a second column with a normalized text, stripped of special characters, which would be used for searching - but I am missing a class or way how to normalize the String.

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

童话里做英雄 2024-09-21 03:45:42

您是否看过LIKE 的 SQLite 文档？它提供了有关非 ASCII 字符和错误的信息。也许 Android 安装了旧版本的 SQLite，这是一个问题。

不幸的是，我认为第二个标准化列可能是您的最佳选择。

回复收藏 0 原文

羁拥 2024-09-21 03:45:42

就在今天，我的任务与你完全相同。在我的情况下，创建额外的阴影列不是一种情况，因为我必须搜索多个列。于是我就想到了这样的解决方案，并在实际项目中进行了测试。就我而言，我仅处理小写字母，但您也可以使用大写字母扩展该功能。

db.setLocale(Locale("cz", "CZ"))
val query = "SELECT * FROM table WHERE name GLOB ${getExpr(str)} ORDER BY name COLLATE LOCALIZED ASC"

private fun getExpr(input: String) : String{
    var expr = ""
    for(lettter in input){
        expr += when(lettter){
            's','š' -> "[sš]"
            'a','á' -> "[aá]"
            'e','ě','é' -> "[eěé]"
            'i','í' -> "[ií]"
            'z','ž' -> "[zž]"
            'c','č' -> "[cč]"
            'y','ý' -> "[yý]"
            'r','ř' -> "[rř]"
            'u','ů','ú' -> "[uůú]"
            'o','ó' -> "[oó]"
            'n','ň' -> "[nň]"
            'd','ď' -> "[dď]"
            't','ť' -> "[tť]"
            else -> lettter
        }
     }
     return "'*${expr}*'"
}

Just today i had exactly the same task as you had. And in my situation making additional shadow columns is not a case because i'm having to search more than one column. So i came to the solution like this, which is tested in real project. In my case i'm handling only lower case letters but you can extend the function with upper case letters as well.

db.setLocale(Locale("cz", "CZ"))
val query = "SELECT * FROM table WHERE name GLOB ${getExpr(str)} ORDER BY name COLLATE LOCALIZED ASC"

private fun getExpr(input: String) : String{
    var expr = ""
    for(lettter in input){
        expr += when(lettter){
            's','š' -> "[sš]"
            'a','á' -> "[aá]"
            'e','ě','é' -> "[eěé]"
            'i','í' -> "[ií]"
            'z','ž' -> "[zž]"
            'c','č' -> "[cč]"
            'y','ý' -> "[yý]"
            'r','ř' -> "[rř]"
            'u','ů','ú' -> "[uůú]"
            'o','ó' -> "[oó]"
            'n','ň' -> "[nň]"
            'd','ď' -> "[dď]"
            't','ť' -> "[tť]"
            else -> lettter
        }
     }
     return "'*${expr}*'"
}

回复收藏 0 原文

不奢求什么 2024-09-21 03:45:42

在 Android sqlite 中，LIKE 和 GLOB 会忽略 COLLATE LOCALIZED 和 COLLATE UNICODE （它们仅适用于 排序依据）。但是，正如 @asat 在他的答案中所解释的那样，您可以将 GLOB 与以下模式一起使用：将每个字母替换为该字母的所有可用替代项。在 Java 中：

public static String addTildeOptions(String searchText) {
    return searchText.toLowerCase()
                     .replaceAll("[aáàäâã]", "\\[aáàäâã\\]")
                     .replaceAll("[eéèëê]", "\\[eéèëê\\]")
                     .replaceAll("[iíìî]", "\\[iíìî\\]")
                     .replaceAll("[oóòöôõ]", "\\[oóòöôõ\\]")
                     .replaceAll("[uúùüû]", "\\[uúùüû\\]")
                     .replace("*", "[*]")
                     .replace("?", "[?]");
}

然后（当然，不是字面意思）：

SELECT * from table WHERE lower(column) GLOB "*addTildeOptions(searchText)*"

这样，例如在西班牙语中，搜索 mas 或 más 的用户将获得搜索转换转换成m[aáàäâã]s，返回两个结果。

值得注意的是，GLOB 忽略了 COLLATE NOCASE，这就是我在函数和查询中将所有内容都转换为小写的原因。另请注意，sqlite 中的 lower() 函数不适用于非 ASCII 字符 - 但同样，这些字符可能是您已经替换的字符！

该函数还将 GLOB 通配符 * 和 ? 替换为“转义”版本。

In Android sqlite, LIKE and GLOB ignore both COLLATE LOCALIZED and COLLATE UNICODE (they only work for ORDER BY). However, as @asat explains in his answer, you can use GLOB with a pattern that will replace each letter with all the available alternatives of that letter. In Java:

public static String addTildeOptions(String searchText) {
    return searchText.toLowerCase()
                     .replaceAll("[aáàäâã]", "\\[aáàäâã\\]")
                     .replaceAll("[eéèëê]", "\\[eéèëê\\]")
                     .replaceAll("[iíìî]", "\\[iíìî\\]")
                     .replaceAll("[oóòöôõ]", "\\[oóòöôõ\\]")
                     .replaceAll("[uúùüû]", "\\[uúùüû\\]")
                     .replace("*", "[*]")
                     .replace("?", "[?]");
}

And then (not literally like this, of course):

SELECT * from table WHERE lower(column) GLOB "*addTildeOptions(searchText)*"

This way, for example in Spanish, a user searching for either mas or más will get the search converted into m[aáàäâã]s, returning both results.

It is important to notice that GLOB ignores COLLATE NOCASE, that's why I converted everything to lower case both in the function and in the query. Notice also that the lower() function in sqlite doesn't work on non-ASCII characters - but again those are probably the ones that you are already replacing!

The function also replaces both GLOB wildcards, * and ?, with "escaped" versions.