当前位置：文江博客话题详情

Lucene.NET 的独立于文化的词干分析器/分析器

发布于 2024-10-27 09:37:12 字数 194 浏览 4 评论 0原文

我们目前正在开发一个支持全文搜索的应用程序，Lucene.NET 是我们选择的武器。预计应用程序将由来自不同国家/地区的人们使用，因此 Lucene.NET 必须能够同样出色地搜索俄语、英语和其他文本。

是否有通用且独立于文化的词干分析器和分析器可以满足我们的需求？我知道最终我们必须使用特定于文化的方法，但我们希望使用这种可能快速但肮脏的方法来启动和运行。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

小梨窩很甜 2024-11-03 09:37:13

鉴于英语和俄语的拼写、语法和字符集显着不同，任何试图同时执行这两种操作的词干分析器要么非常大，要么性能很差（很可能两者兼而有之）。

最好为每种语言使用词干分析器，并根据 UI 线索（用于查询的语言）或通过显式选择来选择要使用的词干分析器。

话虽如此，任何俄语文本都不太可能正确匹配英语搜索词，反之亦然。

这听起来像是多一点业务分析比编写代码更有帮助的情况。

回复收藏 0 原文

独自唱情﹋歌 2024-11-03 09:37:13

不存在独立于语言的词干分析器这样的东西。事实上，词干提取是否能提高检索性能因语言而异。您能做的最好的事情就是对文档和查询进行语言猜测，然后分派给适当的分析器/词干分析器。

不过，对短查询的语言猜测是困难（就像最先进的那样，不是快速'n'脏）。如果您的查询很短，您可能希望在查询上使用简单的空白分析器，而不是阻止任何内容。

回复收藏 0 原文

~没有更多了~

关于作者

一梦等七年七年为一梦

暂无简介

0 文章

0 评论

24 人气

关注发私信

苦中寻乐

文章 0 评论 0

关注

lueluelue

文章 0 评论 0

关注

嗼ふ静

文章 0 评论 0

关注

王权女流氓

文章 0 评论 0

关注

与花如笺

文章 0 评论 0

关注

残酷

文章 0 评论 0

友情链接

文江博客

Lucene.NET 的独立于文化的词干分析器/分析器

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

苦中寻乐

lueluelue

嗼ふ静

王权女流氓

与花如笺

残酷

友情链接

Lucene.NET 的独立于文化的词干分析器/分析器

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

苦中寻乐

lueluelue

嗼ふ静

王权女流氓

与花如笺

残酷

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。