如何编写使用apache nutch 1.3 api爬行网站的java代码?

发布于 2024-12-02 09:17:11 字数 69 浏览 0 评论 0原文

我想用java和nutch 1.3 api编写一个程序来抓取网站 我在网上搜索但没有示例代码 我怎样才能做到这一点? 谢谢

I want to write a program with java and nutch 1.3 api to crawl the the sites
i searched the web but there is no sample code
how can i do that?
thanks

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

一城柳絮吹成雪 2024-12-09 09:17:11

好吧,您不需要为此编写任何 Java 代码...只需安装 Nutch 即可。但是您应该安装独立的 Nutch 1.2。
使用Nutch1.3需要自己安装hadoop,并且需要安装&用户 Solr 也用于 webseach。

Well you don't need to write any Java code to that... just install Nutch and off you go. However you should install Nutch 1.2 which is self contained.
With Nutch1.3 you need to install hadoop yourself and you need to install & user Solr for the webseach too.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文