选择后 Jsoup baseUri 消失了
我刚刚发现,通过选择获得的每个元素都需要设置 baseUri。如果将 Document 的 baseUri 应用于每个 Element 会好很多。
Document d = Jsoup.parse(myString);
doc.setBaseUri("http://www.google.de");
如果我执行
Element e = d.select(....).get(0);
e
的baseUri为空。
这是一个错误还是有意为之?
I just discovered that setting the baseUri is necessary for each Element you get by doing a select. It would be a lot better if the baseUri of the Document is applied to each Element.
Document d = Jsoup.parse(myString);
doc.setBaseUri("http://www.google.de");
If I execute
Element e = d.select(....).get(0);
The baseUri of e
is empty.
Is this a bug or is it intended?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
基本 URI 特定于每个元素,因为在 HTML 中,基本 URI 在解析过程中可能会发生变化。目前,在解析后将其设置在文档上不会将其冒泡到子节点。
只需 指定 当你解析 HTML 字符串时,例如:
如果你从 URL 获取 HTML 并解析它(使用 Jsoup.connect),基本 URI 是自动设置。
The base URI is specific to each element, as there are cases in HTML where the base URI can change throughout the parse. Currently, setting it on the document after the parse does not bubble it down to child nodes.
Just specify it when you parse the HTML string, e.g.:
If you fetch the HTML from a URL and parse that (with Jsoup.connect), the base URI is automatically set.