选择后 Jsoup baseUri 消失了

发布于 2024-11-25 13:09:15 字数 313 浏览 1 评论 0原文

我刚刚发现,通过选择获得的每个元素都需要设置 baseUri。如果将 Document 的 baseUri 应用于每个 Element 会好很多。

Document d = Jsoup.parse(myString);
doc.setBaseUri("http://www.google.de");

如果我执行

Element e = d.select(....).get(0);

e的baseUri为空。

这是一个错误还是有意为之?

I just discovered that setting the baseUri is necessary for each Element you get by doing a select. It would be a lot better if the baseUri of the Document is applied to each Element.

Document d = Jsoup.parse(myString);
doc.setBaseUri("http://www.google.de");

If I execute

Element e = d.select(....).get(0);

The baseUri of e is empty.

Is this a bug or is it intended?

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

故事未完 2024-12-02 13:09:15

基本 URI 特定于每个元素,因为在 HTML 中,基本 URI 在解析过程中可能会发生变化。目前,在解析后将其设置在文档上不会将其冒泡到子节点。

只需 指定 当你解析 HTML 字符串时,例如:

Document doc = Jsoup.parse(myString, "http://www.google.de");

如果你从 URL 获取 HTML 并解析它(使用 Jsoup.connect),基本 URI 是自动设置。

The base URI is specific to each element, as there are cases in HTML where the base URI can change throughout the parse. Currently, setting it on the document after the parse does not bubble it down to child nodes.

Just specify it when you parse the HTML string, e.g.:

Document doc = Jsoup.parse(myString, "http://www.google.de");

If you fetch the HTML from a URL and parse that (with Jsoup.connect), the base URI is automatically set.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文