当前位置：文江博客话题详情

Solandra 分片：内部想法

发布于 2024-12-22 13:01:23 字数 1016 浏览 1 评论 0原文

刚刚开始使用 Solandra，并试图了解第二个 Solandra 分片的级别详细信息。

AFAIK Soalndra 创建配置的分片数量（如 “solandra.shards.at.once”属性），其中每个分片的大小为 “solandra.maximum.docs.per.shard”。

在下一个级别开始在每个分片内创建插槽，其定义为 “solandra.maximum.docs.per.shard”/“solandra.index.id.reserve.size”。

我从 SchemaInfo CF 的数据模型中了解到特定分片有不同物理节点拥有的插槽，并且这是节点之间为获得这些插槽而发生的竞赛。

我的问题是：

这是否意味着我请求在特定 solr 节点上写入例如 .....solandra/abc/dataimport?command=full-import 执行此请求被分发到所有可能的节点等。这是分布式写入吗？因为在那之前，其他节点将如何竞争特定分片内的插槽。理想情况下，用于编写文档或一组文档将在单个物理 JVM 上执行。
通过分片，我们尝试在单个物理节点上编写一些文档但如果它是基于不同拥有的插槽进行写入物理节点，我们实际实现了什么，因为我们再次需要从不同节点获取结果。我明白写吞吐量最大化。
我们可以考虑调整这些数字吗？ “solandra.maximum.docs.per.shard”， "solandra.index.id.reserve.size","solandra.shards.at.once" 。
如果我在单个 DC 中只有一个分片且复制因子为 5 6个节点设置，我看到这个分片的端点包含5个根据复制因子的端点。但是第六个会发生什么一。我通过nodetool看到左边第6个节点并没有真正得到任何数据。如果我将复制因子增加到 6，同时保持集群上，这会解决问题并进行修复等吗？有更好的方法。