Android 中的 HTML 解析

发布于 2024-10-14 19:33:51 字数 183 浏览 4 评论 0原文

我正在尝试学习如何解析 HTML,但由于我在 Java 或 Android 方面没有太多经验,所以有点复杂。我已阅读 IBM XML 解析教程并学会了解析 RSS 提要。我的问题是:我想从 HTML 站点获取数据。我已经阅读了一些有关 HTML 清理器、JSON 等的信息,但我找不到好的教程来帮助我。您有任何可能有用的教程吗?

谢谢。

I am trying to learn how to parse HTML, but as I don't have a lot of experience in either Java or Android, it's a little complicated. I have read the IBM XML parsing tutorial and have learned to parse an RSS feed. My problem is: I would like to get data from an HTML site. I have read some information on HTML cleaner, JSON, etc., but I can't find a good tutorial to help me. Do you have any tutorials that might be helpful?

Thanks.

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(2

白云不回头 2024-10-21 19:33:51

查看以下 HTML 解析器。还有更多。也许有一个适合您:

Check out the following HTML parsers. There are more out there. Maybe one will work for you:

歌入人心 2024-10-21 19:33:51

IMO 有两种简单的方法来解析 HTML:

  • 使用库(例如 HTMLTidy)将 HML 转换为 XML (XHTML),然后使用 XML 解析器
  • 使用现有的 HTML 解析器(例如标准 Web 浏览器,如 WebKit、ForeFox 和/或IE),然后读取“DOM”,它是解析后的 H​​TML 的或多或少 API 友好的表示。

或者,如果你想编写自己的解析器(我怀疑你应该这样做,作为家庭作业:它会很长)并且正确/完整地实现它很复杂),请参阅解析 HTML 的规范

IMO there are two easy ways to parse HTML:

  • Convert the HML to XML (XHTML) using a library (e.g. HTMLTidy) and then use an XML parser
  • Use an existing HTML parser (e.g. a standard Web browser like WebKit, ForeFox, and/or IE) and then read the "DOM" which is a more-or-less-API-friendly representation of the parsed HTML

Alternatively, if you want to write your own parser (which I doubt you should, for homework: it would be long and complicated to implement it properly/completely), see the specs for parsing HTML.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文