MongoDb startswith和全文索引问题

发布于 2022-09-03 15:17:04 字数 135 浏览 19 评论 0

场景是目前有个Mongo的collection中的name字段,name字段长度正常在4-10个中文左右,25W数据量。如果我用startswith匹配name查询的话性能会有怎样的压力呢?
如果给name字段加上全文索引又会有什么样的好处和坏处呢?

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

梦醒灬来后我 2022-09-10 15:17:04

如果有普通索引的情况下,前缀固定的查询是可以用到索引的。但是不知道你说的startswith是什么方法,如果是驱动里面的,具体还要看是什么驱动及它的文档怎么说。我所指的前缀固定是正则表达式以^开头的匹配,比如:

db.collection.find({name: /^张/})

如果看一下执行计划,是能看到IX_SCAN的:

db.collection.find({name: /^张/}).explain(true)

全文索引就是另一个东西了。简单地说,可以不考虑前缀是否固定,但是全文索引的基本单位是不是字。所以下面这段话:

一师 是 个 好学校

搜索的时候可以直接找你要的词,比如:

db.collection.find({ $text: { $search: "好学校" } })

但是直接搜“校”很可能是搜不到的:

db.collection.find({ $text: { $search: "校" } })  // 无结果

当然这跟不同的分词引擎怎么分法有关,例子只是为说明全文索引的局限性。
另外冠词,量词等没有实际意义的词也是会被过滤掉的,比如“个”:

db.collection.find({ $text: { $search: "个" } })  // 无结果

另外可能你也注意到了上面的查询根本没提到name这个字段,因为一个集合上面只能有一个全文索引。

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文