当前位置：文江博客话题详情

单核或多核 Solr

发布于 2024-11-16 12:44:49 字数 174 浏览 3 评论 0原文

我们计划部署 Solr 来搜索从通用 CMS 平台发布的多个站点。

每种语言都会有单独的网站，而其他语言的内容大多是从英语翻译而来的。

搜索要求包括 - 关键字突出显示、建议（“您是说吗？”）、停用词、分面。

我们正在评估使用单核与每种语言的多核 Solr 选项。这里推荐的方法是什么？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

霞映澄塘 2024-11-23 12:44:49

您需要多核，因为您无法在多语言数据库上进行词干提取和停用词处理。

英语中常见的停用词是“by”和“is”，但这些词在许多北欧语言中表示“城镇”和“冰”。

如果您采用多核，每种语言都可以在自己的核心上使用自定义的 schema.xml，选择正确的词干分析器、停用词和受保护的词。但是同一个 JVM 在同一台服务器上运行所有这些内容，因此您无需为一种特定语言的服务器花费任何额外的费用。然后，如果负载对于一台服务器来说太大，您可以复制多核设置，所有索引都会从副本中受益。

回复收藏 0 原文