当前位置：文江博客话题详情

Objective-C iPhone html-parsing hpple

Objective-c - 我应该使用哪个库来解析 HTML？

发布于 2024-11-28 19:26:12 字数 812 浏览 7 评论 0原文

我正在尝试解析 iPhone 中的一些不复杂的 RSS html 内容。

所以我不需要笨重的 HTML 解析器。

我在这里搜索并找到了这两个：

https://github.com/topfunky/hpple

https://github.com/zootreeves/Objective-C-HMTL-Parser

两者都很简单使用。但我想他们为了我的目的而有他们的问题。

对于 TFHpple 来说，这很好，但是对于每个元素，它没有完整的 HTML <> 。与它自己。例如，element 没有这个完整的标签字符串。我需要这个完整的标记字符串，因为我需要将其从整个 HTML 字符串中删除。如果element有这个的话我会更方便。

对于zootreeves HTML-Parser来说，也简单又好。它具有每个元素的完整标记字符串。我很高兴。然而，它似乎是一个很大的内存消耗者。我监控了它。如果我尝试解析大量 HTML 片段（例如 1000 个），则它将消耗并占用的内存约为 40MB。它不适用于 ios 设备。我猜，zootreeves 使用纯 C 代码和链表来组织 HTML 的树结构。它使用纯 malloc 和 free 内存。不知道会不会影响ios内存。

那么，有人可以为我推荐一个最先进的、更好、更快、更简单的 iO HTML 解析器吗？

谢谢

收藏 0

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

评论（1）

我的黑色迷你裙 2024-12-05 19:26:12

我会使用 libxml2。它不仅仅适用于 xml；它还适用于 xml。它也有一个 HTML 解析器。它速度快、占用内存少，并且可在 iOS 中使用。唯一的缺点是它是基于 C 的 API，但尽管如此，使用起来并不是非常困难。

更新

回应下面第一条评论：已经有一段时间了，所以我不确定，但我不这么认为。您得到的是一个包含大量有关文档结构信息的数据结构，每个标签都有一个属性/值对列表。原始的 html 字符串没有存储在任何地方（我认为这被认为是多余的，并且不是为了节省内存）。

但是，您似乎并不真正需要它来完成您想做的事情。在我看来，您正在使用解析器中的信息来修改原始字符串，删除 HTML 标签。相反，您想要做的是使用解析树中的信息重建文档，并且在执行此操作时，忽略您想要省略的标签。

回复收藏 0 原文

~没有更多了~

关于作者

假情假意假温柔

暂无简介

文章

评论

27 人气

关注发私信

相关话题

热门标签

操作系统程序设计 IT运维 Linux系统管理 JavaScript 服务器应用 solaris C/C++ PHP Shell BSD Vue.js aix Oracle Python HTML 系统管理 HTML5 CSS 前端

推荐作者

裸钻

文章 0 评论 0

执手闯天涯

文章 0 评论 0

2401825754

文章 0 评论 0

就此别过

文章 0 评论 0

我为君王

文章 0 评论 0

机场等船

文章 0 评论 0

友情链接

我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的隐私政策了解更多相关信息。单击 接受 或继续使用网站，即表示您同意使用 Cookies 和您的相关数据。

原文