如何编写使用apache nutch 1.3 api爬行网站的java代码?
我想用java和nutch 1.3 api编写一个程序来抓取网站 我在网上搜索但没有示例代码 我怎样才能做到这一点? 谢谢
I want to write a program with java and nutch 1.3 api to crawl the the sites
i searched the web but there is no sample code
how can i do that?
thanks
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
好吧,您不需要为此编写任何 Java 代码...只需安装 Nutch 即可。但是您应该安装独立的 Nutch 1.2。
使用Nutch1.3需要自己安装hadoop,并且需要安装&用户 Solr 也用于 webseach。
Well you don't need to write any Java code to that... just install Nutch and off you go. However you should install Nutch 1.2 which is self contained.
With Nutch1.3 you need to install hadoop yourself and you need to install & user Solr for the webseach too.