RSS阅读器然后抓取页面内容

发布于 2024-10-18 09:52:30 字数 175 浏览 5 评论 0原文

我已将 RSS 阅读器集成到我的应用程序中。 如何获取带有 RSS Feed URL 的网页? 有没有免费的 api 可以使用 URL 直接在 Java 中执行此操作?

我必须处理网页的内容(准确地说是新闻文章)并用它做一些算法工作。

现在的问题是做一小部分Crawler。有免费的轻量级 api 吗?

I have integrated the RSS Reader in my application.
How do I grab the Webpage with the RSS Feed URL?
Is there any free api which does this directly in Java using the URL?

I have to process the content of the webpage (news articles to be precise) and do some algorithmic stuff with that.

The problem now is to do a small part of Crawler. Is there any free light weight api's?

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

余生一个溪 2024-10-25 09:52:30

要获取任何 URL 的“内容”,请查看 java.net.URL 类。它有一些有用的方法来获取内容,例如 openConnection()openStream() 来获取内容。

For getting the "content" of any URL, look at the java.net.URL class. It has some useful methods to get the content, like openConnection() and openStream() to get the content.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文