Nutch 到底是怎么回事?
我要制作自己的搜索引擎。
在搜索搜索引擎、爬虫等内容时,我对Nutch感到困惑。
我不明白什么是Nutch。它是像 Lucene 这样的内部使用(如果我错了请纠正我)还是用于创建搜索引擎的框架(例如:google、bing、yahoo)?
Im going to make my own search engine.
When searching about search engine, crawler, and so on, I confused about Nutch.
I don’t understand what is Nutch. Is it for internal use like Lucene (correct me if Im wrong) or a framework for creating a search engine (example:google, bing, yahoo)?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(2)
Nutch 是一个全功能的搜索引擎 - 它可以抓取外部网站,并且理解并尊重 robots.txt。
http://nutch.apache.org/about.html
Nutch is a full featured search engine - it can crawl external web sites, and it understands and respects robots.txt.
http://nutch.apache.org/about.html
Nutch 是一个现成的、可配置的网络爬虫,带有用于执行搜索的 Java Servlet。如果您想将其作为一个项目来完成,Nutch 可能会做太多事情,因为剩下的就是创建用于输入搜索和显示结果的页面。
Nutch is a ready-made, configurable web crawler with a Java Servlet for performing searches. If you wanted to do this as a project, Nutch probably does too much since all that's left is creating the pages for entering searches and displaying results.