RSS阅读器然后抓取页面内容
我已将 RSS 阅读器集成到我的应用程序中。 如何获取带有 RSS Feed URL 的网页? 有没有免费的 api 可以使用 URL 直接在 Java 中执行此操作?
我必须处理网页的内容(准确地说是新闻文章)并用它做一些算法工作。
现在的问题是做一小部分Crawler。有免费的轻量级 api 吗?
I have integrated the RSS Reader in my application.
How do I grab the Webpage with the RSS Feed URL?
Is there any free api which does this directly in Java using the URL?
I have to process the content of the webpage (news articles to be precise) and do some algorithmic stuff with that.
The problem now is to do a small part of Crawler. Is there any free light weight api's?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
要获取任何 URL 的“内容”,请查看
java.net.URL
类。它有一些有用的方法来获取内容,例如openConnection()
和openStream()
来获取内容。For getting the "content" of any URL, look at the
java.net.URL
class. It has some useful methods to get the content, likeopenConnection()
andopenStream()
to get the content.