如何在 Java 中获取 HTML
在不使用任何外部库的情况下,将网站的 HTML 内容提取到字符串中的最简单方法是什么?
Without the use of any external library, what is the simplest way to fetch a website's HTML content into a String?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(6)
我目前正在使用这个:
但不确定是否有更好的方法。
I'm currently using this:
But not sure if there's a better way.
它不是库,而是一个名为curl的工具,通常安装在大多数服务器中,或者您可以通过以下方式轻松安装在ubuntu中然后
获取任何html页面并将其存储到本地文件(如示例)
您将获得主页html。您可以运行它也在您的浏览器中。
Its not library but a tool named curl generally installed in most of the servers or you can easily install in ubuntu by
Then fetch any html page and store it to your local file like an example
You will get the home page html.You can run it in your browser as well.
这对我来说效果很好:
不确定提供的其他解决方案是否更有效。
This has worked well for me:
Not sure at to whether the other solution(s) provided are any more efficient or not.
我刚刚在您的其他帖子中留下了这篇文章,尽管你上面的方法也可能有效。 我认为其中任何一个都不比另一个更容易。 只需在代码顶部使用
import org.apache.commons.HttpClient
即可访问 Apache 包。编辑:忘记链接了;)
I just left this post in your other thread, though what you have above might work as well. I don't think either would be any easier than the other. The Apache packages can be accessed by just using
import org.apache.commons.HttpClient
at the top of your code.Edit: Forgot the link ;)
虽然不是普通的 Java,但我将提供一个更简单的解决方案。 使用 Groovy ;-)
Whilst not vanilla-Java, I'll offer up a simpler solution. Use Groovy ;-)