为子字符串搜索建立索引?

发布于 2024-11-26 12:40:01 字数 1540 浏览 0 评论 0原文

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(3

鲜血染红嫁衣 2024-12-03 12:40:01

这种情况下的最佳索引结构是 后缀树
Lucene 没有实现这种类型的索引,因此它的子字符串搜索速度很慢。但是 lucene 有前缀树索引,这意味着如果您通过前缀搜索术语,您可以进行快速搜索。

Best index structure for this case is suffix tree
Lucene does not implements this type of index so its substring search is slow. But lucene has prefix tree index which mean you can do fast search if you search terms by their prefix.

要走就滚别墨迹 2024-12-03 12:40:01

自 2011 年 4 月 22 日版本 2.0.1-beta 起,Sphinx 确实支持有效的子字符串搜索。不幸的是,截至今天,此支持仅考虑beta 版本,如此处所述。

我尝试了2.1.1 beta版本。它似乎工作正常。请参阅手动输入了解字典类型,了解关键字< /代码> 类型。

当我尝试使用 2.0.6 发行版时,它回退到低效的 crc 索引,在索引期间给出以下警告:

WARNING: min_infix_len is not supported yet with dict=keywords; using dict=crc

我的最小配置文件:

source sour
{
  type = xmlpipe2
  xmlpipe_command = type C:\Temp\1\sphinx\input.xml
}

index inde
{
  source = sour
  path = testpa
  enable_star = 1
  dict = keywords
  charset_type = utf-8
  min_infix_len = 1
}

Sphinx does support effective substring searches since Version 2.0.1-beta, 22 apr 2011. Unfortunately as of today this support regards only beta versions, as mentioned here.

I made a try with 2.1.1 beta version. It seems to work correctly. See the manual entry for dictionary type, read about keywords type.

When I tried to use 2.0.6 release version, it fell back to inefficient crc index, giving the following warning during indexing:

WARNING: min_infix_len is not supported yet with dict=keywords; using dict=crc

My minimal configuration file:

source sour
{
  type = xmlpipe2
  xmlpipe_command = type C:\Temp\1\sphinx\input.xml
}

index inde
{
  source = sour
  path = testpa
  enable_star = 1
  dict = keywords
  charset_type = utf-8
  min_infix_len = 1
}
我还不会笑 2024-12-03 12:40:01

sqlite 有一个名为 fts5 的全文扩展。看起来稳定又自由。

sqlite has a full-text extension called fts5. It looks stable and free.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文