解析 XML/“屏幕抓取”的最佳方法是什么？在 iOS 中？ UIWebview 还是 NSXMLParser？

发布于 2024-09-15 10:52:46 字数 673 浏览 7 评论 0原文

我正在创建一个 iOS 应用程序，需要从网页获取一些数据。我的第一个想法是使用 NSXMLParser initWithContentsOfURL: 并使用 NSXMLParser 委托解析 HTML。然而，这种方法似乎很快就会变得痛苦（例如，如果 HTML 发生变化，我将不得不重写解析代码，这可能会很尴尬）。

当我加载网页时，我也查看了 UIWebView 。看起来 UIWebView 可能是正确的选择。 stringByEvaluatingJavaScriptFromString: 似乎是一种非常方便的提取数据的方法，并且允许将 JavaScript 存储在一个单独的文件中，如果 HTML 发生更改，该文件很容易编辑。然而，使用 UIWebView 似乎有点老套（因为 UIWebView 是一个 UIView 子类，它可能会阻塞主线程，文档说javascript 有 10MB 的限制）。

在我陷入困境之前，有人对解析 XML/HTML 有什么建议吗？

更新：

我写了一篇关于我的解决方案的博客文章：HTML 解析/屏幕抓取在 iOS 中

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

孤千羽 2024-09-22 10:52:46

我已经这样做过几次了。我发现的最好方法是使用 libxml2，它具有 HTML 模式。然后就可以使用XPath来查询文档了。

使用 libxml2 API 并不是最令人愉快的。因此，我通常会带来此页面上记录的 XPathQuery.h/.m 文件：

http://cocoawithlove.com/2008/10/using-libxml2-for-parsing-and-xpath.html

然后我使用 NSConnection 获取数据并使用某些内容查询数据像这样：

NSArray *tdNodes = PerformHTMLXPathQuery(self.receivedData, @"//td[@class='col-name']/a/span");

摘要：

将 libxml2 添加到您的项目中，以下是 XCode4 的一些快速说明：
http://cmar.me/2011 /04/20/adding-libxml2-to-an-xcode-4-project/
获取 XPathQuery.h/.m
使用使用 XPath 语句查询 html 文档。

I've done this a few times. The best approach I've found is to use libxml2 which has a mode for HTML. Then you can use XPath to query the document.

Working with the libxml2 API is not the most enjoyable. So, I usually bring over the XPathQuery.h/.m files documented on this page:

http://cocoawithlove.com/2008/10/using-libxml2-for-parsing-and-xpath.html

Then I fetch the data using a NSConnection and query the data with something like this:

NSArray *tdNodes = PerformHTMLXPathQuery(self.receivedData, @"//td[@class='col-name']/a/span");

Summary:

Add libxml2 to your project, here are some quick instructions for XCode4:
http://cmar.me/2011/04/20/adding-libxml2-to-an-xcode-4-project/
Get the XPathQuery.h/.m
Use an XPath statement to query the html document.

回复收藏 0 原文