Apache Solr 能否处理 TB 大数据

发布于 2024-12-26 04:30:30 字数 548 浏览 6 评论 0原文

我是 apache solr 用户大约一年了。我使用 solr 作为简单的搜索工具，但现在我想使用 solr 处理 5TB 的数据。我假设当 solr 根据我使用的过滤器对其进行索引时，5TB 数据将是 7TB。然后我会每小时向同一个索引添加近 50MB 的数据。

1-使用单个 solr 服务器处理 5TB 数据是否有任何问题。（没有分片）

a- solr 服务器能否在可接受的时间内回答查询
b- 提交 50MB 数据的预期时间是多少在 7TB 索引上。
c- 索引大小是否有上限。

2- 您提供的建议是什么

a- 我应该使用多少个分片
b- 我应该使用 solr 核心
c- 您提供的提交频率是多少。（1 小时即可）

3-这种大数据有测试结果吗

没有可用的 5TB 数据，我只是想估计一下结果。

注意：您可以假设硬件资源不是问题。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

眼眸里的那抹悲凉 2025-01-02 04:30:30

如果您的大小适用于文本，而不是二进制文件（其文本通常会少得多），那么我认为您不能假装在一台机器上执行此操作。

这听起来很像 Logly 并且他们使用 SolrCloud 来处理如此大量的数据。

好吧，如果所有都是丰富的文档，那么索引的总文本大小将会小得多（对我来说，大约是起始大小的 7%）。不管怎样，即使数量减少了，我认为单个实例的数据仍然太多。

回复收藏 0 原文

~没有更多了~

关于作者

椒妓

暂无简介

文章

26 人气

关注发私信

十二

文章 0 评论 0

关注

飞烟轻若梦

文章 0 评论 0

关注

OPleyuhuo

文章 0 评论 0

关注

wxb0109

文章 0 评论 0

关注

旧城空念

文章 0 评论 0

关注

-小熊_

文章 0 评论 0

友情链接

文江博客

Apache Solr 能否处理 TB 大数据

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者