从 Android 手机的 Blogspot 博客中提取 HTML 数据
我环顾四周,找不到任何有帮助的东西。这是我想要做的:
- 从 Blogspot 博客中提取第一篇文章
- 将其显示在屏幕上
我需要一些可以从 html 页面中的特定标签和 id 中提取数据的东西。我还需要它与 Dalvik 格式兼容,因为对于某些库,它表示转换失败并且我的应用程序无法工作。如果它也很简单,那就太好了。
有什么建议吗?
I have looked around and I can't find anything that will help. Here is what I want to do:
- Extract The First Post From a
- Blogspot Blog Display it on the screen
I need something that will pull data from a specific tag and id in a html page. I also need it to be compatible with the Dalvik format because with some libraries it says conversion failed and my application doesn't work. It would be nice if it was straight forward too.
Any suggestions?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(3)
使用 HttpClient 检索页面。使用任何Java HTML 解析器的优势来提取您的帖子。如果您找到您喜欢的库,并且收到“转换失败”错误,请获取源代码而不是 JAR 并将源代码添加到您的项目中 - 您将收到具体的编译错误,然后您可以确定它们是否可以修复。
Use HttpClient to retrieve the page. Use any of the preponderance of Java HTML parsers to extract your post. If you find a library that you like, and you get a "conversion failed" error, grab the source code instead of the JAR and add the source to your project -- you will get concrete compilation errors, and then you can determine if they can be repaired.
如果您只需要文本,我强烈建议您尝试
http://www.alchemyapi.com/api/text/
您可以使用他们的 Android SDK。效果棒极了!我也用它来提取文本。
I highly recommend trying out if you need just text
http://www.alchemyapi.com/api/text/
You can use their Android SDK. It works awesome! I use it too for text extraction.
使用Jsoup你可以通过文件、字符串和url解析html数据。
它还提取带有标签和类的数据
http://jsoup.org/cookbook/
use Jsoup you can parse a html data by file, string and url.
it also extracts data with tags and class
http://jsoup.org/cookbook/