如何将 Jsoup(Java html 解析器)中生成的文档转换为字符串

发布于 2024-11-26 21:06:29 字数 184 浏览 0 评论 0原文

我有一个用 jsoup 制作的文档,如下所示

Document doc = Jsoup.connect("http://en.wikipedia.org/").get();

How do i conversion that doc into a string。

I have a document that was made in jsoup that looks like this

Document doc = Jsoup.connect("http://en.wikipedia.org/").get();

How do i convert that doc into a string.

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(3

故事↓在人 2024-12-03 21:06:29

您是否尝试过:

Document doc = Jsoup.connect("http://en.wikipedia.org/").get();
String htmlString = doc.toString();

由于 Document 扩展了 Element,它还具有方法 html(),该方法根据 “检索元素的内部 HTML” a href="http://jsoup.org/apidocs/">API。所以这应该有效:

Document doc = Jsoup.connect("http://en.wikipedia.org/").get();
String htmlString = doc.html();

附加信息:

每个Document对象都有一个对内部类Document.OutputSettings实例的引用,可以访问它通过 Document 的方法outputSettings()。在那里,您可以使用 setter prettyPrint(true/false) 启用/禁用漂亮打印。请参阅 DocumentDocument.OutputSettings 的 API 了解更多信息

Have you tried:

Document doc = Jsoup.connect("http://en.wikipedia.org/").get();
String htmlString = doc.toString();

As Document extends Element it also has got the method html() which "Retrieves the element's inner HTML" according to the API. So that should work:

Document doc = Jsoup.connect("http://en.wikipedia.org/").get();
String htmlString = doc.html();

Additional Info:

Each Document object has got a reference to an instance of the inner class Document.OutputSettings which can be accessed via the method outputSettings() of Document. There you can enable/disable pretty-printing by using the setter prettyPrint(true/false). See the API for Document and Document.OutputSettings for furtherinformation

溺渁∝ 2024-12-03 21:06:29

doc.toString() 可以工作,doc.outerHtml() 也可以。

doc.toString() works, as does doc.outerHtml().

微凉徒眸意 2024-12-03 21:06:29
 Document doc = Jsoup.connect("http://en.wikipedia.org/").get();     
 Elements post = doc.select("div.post-content");
 String dd = post.toString();
 Document ddd = Jsoup.parse(dd);

将字符串解析为文档后,您可以使用它的文档函数

 Elements scriptTag = ddd.getElementsByTag("script");
 System.out.println(scriptTag);
 Document doc = Jsoup.connect("http://en.wikipedia.org/").get();     
 Elements post = doc.select("div.post-content");
 String dd = post.toString();
 Document ddd = Jsoup.parse(dd);

After parsing the string to document then you can use on it document functions

 Elements scriptTag = ddd.getElementsByTag("script");
 System.out.println(scriptTag);
~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文