Lucene 标准分析器与 Snowball

发布于 2024-09-26 01:31:24 字数 154 浏览 12 评论 0原文

刚刚开始使用 Lucene.Net。我使用标准分析器索引了 100,000 行，运行了一些测试查询，并注意到如果原始术语是单数，则复数查询不会返回结果。我知道雪球分析器增加了词干支持，这听起来不错。不过，我想知道，超过标准的雪球锣是否有任何缺点？我这样做会失去什么吗？还有其他分析仪需要考虑吗？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

栀梦 2024-10-03 01:31:24

是的，通过使用 Snowball 等词干分析器，您会丢失有关文本原始形式的信息。有时这会有用，有时则没有。

例如，Snowball 会将“organization”词干转换为“organ”，因此搜索“organization”将返回包含“organ”的结果，而不会产生任何得分惩罚。

这是否适合您取决于您的内容以及您支持的查询类型（例如，搜索是否非常基本，或者用户是否非常复杂并使用您的搜索来准确过滤结果）。您可能还想研究不太激进的词干分析器，例如 KStem。

回复收藏 0 原文

很糊涂小朋友 2024-10-03 01:31:24

snowball 分析器会提高您的召回率，因为它比标准分析器更具攻击性。因此，您需要评估您的搜索结果，看看您的数据是否需要增加召回率或精确率。

回复收藏 0 原文

风追烟花雨 2024-10-03 01:31:24

我刚刚完成了一个执行词形还原的分析器。这与词干提取类似，只不过它使用上下文来确定单词的类型（名词、动词等）并使用该信息来派生词干。它还在索引中保留单词的原始形式。也许我的库对您有用。不过，它需要 Lucene Java，而且我不知道有任何 C#/.NET 词形还原器。

回复收藏 0 原文

~没有更多了~

关于作者

吐个泡泡

暂无简介

0 文章

0 评论

23 人气

关注发私信

友情链接

文江博客

Lucene 标准分析器与 Snowball

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（3）

关于作者

相关话题

热门标签

推荐作者

游缘惊梦

小兔几

Glik

生生漫

Luxian

Champion-Ming

友情链接

Lucene 标准分析器与 Snowball

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（3）

关于作者

相关话题

热门标签

推荐作者

游缘惊梦

小兔几

Glik

生生漫

Luxian

Champion-Ming

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。