分布式Solr:每次结果数量不同

发布于 2024-12-19 10:51:36 字数 812 浏览 0 评论 0原文

我在 SolrCloud 中使用分面搜索来获取有关我的语料库的一些统计信息。查询是这样的:

http://master-node:8983/solr/select?q=field1:value1&distrib=true&facet=true&facet.field=field1&facet.limit=50000&rows=0& fq=field2:value2

然而,在生产环境中,在大约 5 台机器之间共享大量文档时,主节点每次返回不同数量的结果。 (每个从站本身返回正确的值)。

我预计这是因为分片超时较小,因此我在 solr/conf/solrconfig.xml 中的搜索请求处理程序中添加了以下参数:

<int name="shard-socket-timeout">10000</int>
<int name="shard-connection-timeout">10000</int>

但没有帮助。

我是否缺少一些配置,或者只是一个错误?如果这是一个错误,我该如何克服它(除了手动跟踪每个从站)?

I'm using faceted search in SolrCloud to get some statistics on my corpus. The query is something like this:

http://master-node:8983/solr/select?q=field1:value1&distrib=true&facet=true&facet.field=field1&facet.limit=50000&rows=0&fq=field2:value2

However, in production with high number of documents, shared between ~5 machines, master node returns different number of results each time. (Each slave by itself returns correct value).

I expected it is because of small timeout for shards, so I added following params to the search request handler in solr/conf/solrconfig.xml:

<int name="shard-socket-timeout">10000</int>
<int name="shard-connection-timeout">10000</int>

but it didn't help.

Am I missing some configuration or is it just a bug? If it's a bug, how can I overcome it (except manual tracking of every slave)?

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。
列表为空,暂无数据
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文