如何使用 Hadoop/Hbase 实现网络搜索?
如何使用 Hadoop/Hbase 实现网络搜索。有人可以为我提供一些入门指南或教程吗?
How do I implement a web search using Hadoop/Hbase. Can anyone please provide me some guidelines or tutorial just to get started?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(3)
这篇文章是关于 Map-Reduce 的,它给出了一些使用 Map-Reduce 实现信息检索原理的示例。
http://labs.google.com/papers/mapreduce.html
您可能还想查看 Apache Lucene(一个开源信息检索系统)和 Apache Solr
this article is about map-Reduce, and it gives some examples on implementing principals of information retrieval using map-reduce.
http://labs.google.com/papers/mapreduce.html
You might also want to check out Apache Lucene, which is an open source information retrieval system, and Apache Solr
尝试 lily 项目,该项目处理索引 hbase 表数据,索引数据可以轻松用于搜索的实现。这是您可以参考的链接
http://www.lilyproject.org/lily/index.html
Lily 将 Apache HBase、Hadoop 和 Solr 统一为一个全面集成的交互式数据平台,具有易于使用的访问 API、高级数据模型和模式语言、灵活、实时的索引以及富有表现力的搜索能力Apache Solr 的。最重要的是,Lily 是开源的
Try lily project this deals with indexing hbase table data and the indexed data can easily be used for implimentation of search. here is the link that you may refer
http://www.lilyproject.org/lily/index.html
Lily unifies Apache HBase, Hadoop and Solr into a comprehensively integrated, interactive data platform with easy-to-use access APIs, a high-level data model and schema language, flexible, real-time indexing and the expressive search power of Apache Solr. Best of all, Lily is open source
@Yash:
对于 Hbase:
阅读 权威指南。然后阅读 Apache Hbase 指南。这会让你对Hbase更加清楚。
Jmeter 可以帮助您向服务器发送多个查询以进行测试。
Nutch 是一个基于开源 hadoop 的网络爬虫。 Solr 是一个内部利用 lucene 的搜索平台。您可以查看这些内容以了解它们的设计并实现您的网络搜索应用程序。
@Yash:
For Hbase:
Read chapter on Hbase from Definitive guide. Then read Apache Hbase guide. This will make you more clear about Hbase.
Jmeter can help you to send multiple queries to server for testing purpose.
Nutch is a open source hadoop based web crawler. Solr is a search platform which leverages lucene internally. You might peek into these to understand their design and implement your web search app.