当前位置：文江博客话题详情

全文干扰词 - 背后的逻辑

发布于 2024-12-10 19:59:13 字数 147 浏览 0 评论 0 原文

正如标题所描述的，在全文搜索中实施干扰词以避免这些词被搜索背后的逻辑是什么？我的意思是，如果有人搜索“to be or not to be”怎么办？没有显示结果？如果有人能告诉我背后的逻辑，我将非常感激，因为我即将禁用 ft_stopword_file。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

优雅的叶子 2024-12-17 19:59:13

使用这些停用词的原因是为了避免全文索引变得臃肿。它有助于提高性能和存储能力。如果您包含所有停用词（或禁用它们），那么它会在一定程度上降低全文搜索的性能。

回复收藏 0 原文

妄想挽回 2024-12-17 19:59:13

如果禁用停用词，那么性能将急剧下降。解决方法是检查您的 php 代码以查看停用词在搜索查询中是否常见，并为这些查询调整“LIKE”搜索，或者简单地使用 sphinx 作为搜索引擎。停用词背后的逻辑是禁用搜索词，例如“is，are，be，there，not”等......

回复收藏 0 原文

请远离我 2024-12-17 19:59:13

逻辑是这些词非常常见，它们会创建大型索引节点并降低系统性能，并且对用户来说毫无用处，因为“to”和“be”如此常见且没有上下文。

更好的索引方法是使用 ngram 来查找像“to be”这样的引用短语，但这种索引非常罕见。

回复收藏 0 原文

~没有更多了~

关于作者

寄离

暂无简介

0 文章

0 评论

23 人气

关注发私信

友情链接

文江博客

全文干扰词 - 背后的逻辑

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（3）

关于作者

相关话题

热门标签

推荐作者

已经忘了多久

15867725375

LonelySnow

走过海棠暮

轻许诺言

信馬由缰

友情链接

全文干扰词 - 背后的逻辑

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（3）

关于作者

相关话题

热门标签

推荐作者

已经忘了多久

15867725375

LonelySnow

走过海棠暮

轻许诺言

信馬由缰

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。