Jsoup

Jsoup

文章 218 浏览 222

jsoup 白名单宽松模式对于所见即所得编辑器来说过于严格

我正在尝试使用 jsoup 来清理从我的客户端中的所见即所得发布的 html(碰巧是tinymce) 宽松模式似乎不够宽松,因为默认情况下它会删除 span 元素和任…

柠檬色的秋千 2025-01-04 05:04:37 6 0

从 Div 标签获取文本

我有一个主 Div 标签,其中包含多个 div 标签,如下所示。子 Div 标签没有与其他子 div 标签区分开的 class/id。现在我想从第二个子 Div 标签中提取文…

暖阳 2025-01-03 23:01:43 4 0

如何解析包含多个表的页面

关于如何抓取包含多个表的网页有什么想法吗? 我正在连接到网页 这是一个表,但在同一网页上有多个表 我也不知道如何读取该表... XML: Top 300 Overa…

傻比既视感 2025-01-03 22:19:48 2 0

为什么 Jsoup 在 Java/Android 中抓取数据的方式不同

我一直在尝试从此 URL http://www.isleworthsyon.hounslow 抓取“学校通知”。 sch.uk/ 我尝试在 Java 中抓取文本,然后使用 String.replaceAll 方法…

却一份温柔 2025-01-03 18:54:20 3 0

Apache Commons Text StringEscapeUtils 与 JSoup 预防 XSS?

我想清理用户输入以帮助防止 XSS 攻击,并且我们不一定关心 HTML 白名单,因为我们的用户不需要发布任何 HTML / CSS。 看看现有的替代方案,哪个会更…

荒人说梦 2025-01-03 07:09:26 6 0

如何使用 jsoup 提取维基百科文章中的特定链接?

我正在做一个 NLP 项目,我需要知道如何提取仅位于此 wikipidia 页面的“简介”部分和“地理”部分中的链接: http://en.wikipedia.org/wiki/Boston …

甜心小果奶 2025-01-03 02:03:20 4 0

使用远程数据填充 ListFragment

我有一个 ListFragment,当前填充有静态数据,在编译时修复。我实际上希望从网络上截取列表的数据。 我计划使用 jsoup 进行检索和解析等。但是将 jsou…

风吹短裙飘 2025-01-02 16:14:37 5 0

jsoup - 从维基百科文章中提取文本

我正在编写一些 Java 代码,以便使用维基百科的文本实现 NLP 任务。如何使用 JSoup 提取维基百科文章的所有文本(例如 http:// 中的所有文本en.wikipe…

眉黛浅 2025-01-02 11:06:40 3 0

在 Android 上显示 Jsoup 元素的更快方法

有没有更快的方法将 Jsoup 元素显示到 Android 应用程序上? 我正在开发的应用程序使用 jsoup 下载并解析页面,获取我想要显示的页面的一部分,编辑其…

妄司 2025-01-01 20:45:37 3 0

Android JSOUP 解析网站中的表

我在解析以下网站时遇到问题: http://www.x -rates.com/d/USD/table.html 我对 Android 编程非常非常陌生,我正在考虑创建一个货币转换器,现在我知…

朮生 2025-01-01 07:56:38 4 0

如何使用 Jsoup 管理 cookie?

Jsoup 中是否有一个简单的 cookie 管理器可以按主机存储 cookie? 此线程中的示例非常缺乏。…

她如夕阳 2024-12-29 14:25:24 4 0

无法返回 href (jSoup) 中的文本

这是我用来从下面的 html 片段访问“test”的代码片段。如何从 html 中访问网址 https://www.google.com ? Elements e = doc.getElementsByAttribute…

最丧也最甜 2024-12-29 08:17:53 3 0

jSoup 检查跨度类是否存在

我有一个具有以下格式的 HTML Micky Mouse $88.00  $49.90 在上面的代码中,文章内的标签有一个没有标签的 span class="mick vtEnabled" 。…

悲欢浪云 2024-12-29 03:59:55 4 0

如何使用 jsoup 替换标签

我想用 div 标签替换所有图像标签。我可以选择所有标签,并且我知道我必须使用 replaceWith。但我无法使用它。 如果我使用 TextNode 将其替换为 ; 并…

岁月苍老的讽刺 2024-12-28 20:28:38 4 0

Jsoup 删除引号和撇号

我的代码中有类似的东西 Whitelist whitelist = new Whitelist(); whitelist.addTags("p", "i", "b", "em", "strong", "u"); String content = Jsoup.…

尐偏执 2024-12-28 19:01:14 2 0
更多

推荐作者

夢野间

文章 0 评论 0

百度③文鱼

文章 0 评论 0

小草泠泠

文章 0 评论 0

zhuwenyan

文章 0 评论 0

weirdo

文章 0 评论 0

坚持沉默

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文