当前位置：文江博客话题详情

HBase、Hyptertable、Lucene

发布于 2024-10-16 20:34:38 字数 136 浏览 3 评论 0原文

我正在使用 lucene 中的搜索系统。默认情况下它不是分布式的，所以我正在考虑转向 HBase 或 Hadoop 之类的东西。

HBase 或 Hypertable 等解决方案是否具有内置搜索功能，或者我需要在它们之上实现 Lucene？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

黎歌 2024-10-23 20:34:38

Lucene 与 HBase 或 Hypertable 等 BigTable 克隆有很大不同。如果您只是在寻找分布式 Lucene，那么您应该考虑 Elastic Search 或 Katta 等项目。

Solr/Lucene 也具有在集群上运行的能力，但分区不是自动的。您必须手动创建分片和副本以匹配您正在查找的数据的分布。如果您的基础数据存储在 HBase 之类的东西中，那么设置、修改和更新就会容易得多。

从根本上来说，HBase 和 Lucene 解决的是不同的问题。 Lucene 是一个索引，可以让关键字和其他类型的搜索快速返回。 HBase 是一个可以实时服务各个行的数据存储库；但是HBase不具备在线查询能力。为了获得最佳结果，您必须将它们结合起来。这一领域的一个例子是 Lily (http://outerthought.org/site/products/lily.html )

回复收藏 0 原文

夜深人未静 2024-10-23 20:34:38

您可能还想看看 Lucandra，带有 Cassandra 后端的 Lucene：

https://github.com/tjake/Lucandra

回复收藏 0 原文

掩于岁月 2024-10-23 20:34:38

另一种值得关注的技术是 Katta 或分布式 Lucene，它可以在 HDFS 上运行

回复收藏 0 原文

鞋纸虽美，但不合脚ㄋ〞 2024-10-23 20:34:38

Lucene 提供了两个主要功能：结构化搜索和全文搜索。 Hbase 没有提供任何这些，结构化搜索可以用 hbase 以相对简单的方式完成，这就是我认为 Lilly 所做的。但重建全文搜索会更加困难。为了扩展 Lucene，您仍然可以尝试通过查找可以将数据分割到单独区域的属性来对索引进行分区（您将无法进行跨区域搜索）。然后每个区域就可以有一个集群。

回复收藏 0 原文

~没有更多了~