除了 Jsoup 还有其他解析器吗?

发布于 2024-11-29 17:30:13 字数 656 浏览 0 评论 0原文

如果在我的情况下 Jsoup.parse 由于文件大小而崩溃,那么使用哪种 smalllight 解析器更好,

我的代码在这里并不重要,但在这里:

            Document doc = Jsoup.parse(html);

            Element table = doc.getElementsByTag("table");
            return table;

好的,这实际上是有效的,但是如果我在 PC(dalvik 虚拟机)或 Android 设备(为 Android 操作系统开发)上运行此代码,则会有所不同。我不确定到底是什么问题,但设备上的内存(堆大小)似乎更大,但到目前为止我还没有检查过 - 这只是一个假设。 关于 Jsoup,我能说的是 - 我认为它是最快、最小的库,适合我的情况,在 DOM 基础上解析和清理纯 HTML 代码。如果您需要根据标签(tr、table 等)提取 HTML 的某些部分,那么 Jsoup 是最好的开源 HTML 解析器。当在代码中应用它时,只需要两行,如上面的示例所示。获取 elemnet 或提取 HTML 的某些部分后得到的结果是一个简单的字符串,其中包含您使用 Jsoup 选择的标签。我确信它具有比这更多的功能,只是从未使用过更复杂的东西。

Which small, light parser is it better to use if Jsoup.parse in my case just crashes because of the file size

my code is not important in here, but here:

            Document doc = Jsoup.parse(html);

            Element table = doc.getElementsByTag("table");
            return table;

OK, this actually works, but there is a difference either if I run this code on the PC(dalvik virtual machine) or on the android device(developing for android OS). I am not sure what exactly is the problem, but it seems that the memory(heap size) is bigger on the device, but I have not checked it so far - it is just an assumption.
So what I can say about Jsoup - it is i guess the fastest and smallest library which is suitable for my case to parse and clean pure HTML code on the DOM basis. If you one needs to extarc some part of the HTML based on the tags(tr, table, ... etc) then Jsoup is the best possible open source HTML parser. And when applying it in the code, there are only two lines that are needed, as it is shown in the example above. The result you get after getting elemnets or extracting some part of the HTML is a simple String which contains the tags that you selected with the Jsoup. I am sure it has more functionality than that, just never have used anything more complex.

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

春庭雪 2024-12-06 17:30:13

我猜你正在尝试解析 html 尝试 Jericho

im guessing that your trying to parse html try Jericho

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文