当前位置：文江博客话题详情

Android 上的 SQLite 是否使用支持 FTS 的 ICU 标记生成器构建？

发布于 11-29 17:00 字数 106 浏览 3 评论 0原文

就像标题所说：我们可以使用...USING fts3(tokenizer icu th_TH, ...)。如果可以的话，有谁知道支持哪些区域设置，以及它是否因平台版本而异？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

┊风居住的梦幻卍2024-12-06 17:00:44

不，只有 tokenizer=porter

当我指定 tokenizer=icu 时，我得到“android.database.sqlite.SQLiteException:unknown tokenizer:icu”

另外，此链接暗示如果 Android 没有默认编译它，则不会
可用的
http://sqlite.phxsoftware.com/forums/t/2349.aspx

回复收藏 0 原文

终弃我2024-12-06 17:00:44

对于 API 级别 21 或更高版本，我测试并发现 ICU 分词器已经可用。

但是，为了支持 90% 以上的设备，可以采取一些解决方法。我有一个解决方法的想法，在我的另一个问题中也提到了：解决 Android SQLite 亚洲文本全文搜索

您可以将 ICU 分词器函数移植到 java 或本机 Android 模块中，作为单独的模块，但不直接参与 SQLite。然后使用“外部内容表”链接到虚拟表（从FTS4开始支持）。

添加元组时，将普通内容添加到外部内容表，但在添加到虚拟索引表之前调用独立标记器在单词边界添加人工空格。

在进行元组删除时，再次调用tokenzier以人工空格更新内容表，然后删除虚拟表元组，然后删除内容表元组。

这有点棘手，但与重新编译完整 SQLite 的另一种选择相比，它已经省了不少力。

有关外部内容表及其工作原理，请参阅 https://www.sqlite.org/ fts3.html#section_6_2_2

可用的 ICU 分词器实际上位于 Android SDK 中。使用 BreakIterator.getWordInstance。看起来它甚至支持针对中文等语言的基于字典的分词器。
http://developer.android.com/reference/java/text/BreakIterator。 html

回复收藏 0 原文

嘦怹2024-12-06 17:00:44

我有一些在下面的链接中使用标记化的 Android 代码，也许会有一些帮助：

https://github.com/gast-lib/gast-lib/blob/master/app/src/root/gast/playground/speech/food/db/FtsIndexedFoodDatabase.java

回复收藏 0 原文

~没有更多了~

关于作者

抹茶夏天i‖

暂无简介

文章

26 人气

关注发私信

qq_jyh6zNJB

文章 0 评论 0

关注

晶哥哥很专祎

文章 0 评论 0

关注

聆听风音

文章 0 评论 0

关注

星

文章 0 评论 0

关注

qq_3LFa8Q

文章 0 评论 0

关注

奢华的一滴泪

文章 0 评论 0

友情链接

文江博客

Android 上的 SQLite 是否使用支持 FTS 的 ICU 标记生成器构建？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（3）

关于作者

相关话题

热门标签