ActionScript 不使用 HTMLLoader 加载 HTML 资源

发布于 2024-12-04 02:00:13 字数 296 浏览 2 评论 0原文

我目前正在通过 ActionScript HTMLLoader 下载网站,以便稍后访问 DOM 以从页面中获取一些信息。

问题是:页面上链接的每个资源(图像、样式表、javascript)也会加载,这需要一些额外的时间。我并不真正需要这些资源,因为只有纯 HTML/DOM 才有趣。

有什么办法可以禁用链接资源的加载吗?起初,我尝试使用 URLLoader 并将结果解析为 XML,但是当网站无效时,这不起作用。我也没有找到一个库可以将给定的 HTML 字符串验证/解析为有效的 XML。

我在桌面上使用 Adob​​e AIR。

I'm currently downloading website via an ActionScript HTMLLoader to later have access to the DOM to get some information out of the page.

The problem is: each resource that is linked on the page (images, stylesheets, javascript) is also loaded which takes some additional time. I don't really need those resources, because only the plain HTML/DOM is interesting.

Is there any way to disable loading of linked resources? At first I tried using an URLLoader and parse the result as XML, but when the website isn't valid this doesn't work. I also didn't find a library that validates/parses a given HTML-string into valid XML.

I'm using Adobe AIR on desktop.

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

浅沫记忆 2024-12-11 02:00:13

也许很复杂,但您可以使用 URLLoader 加载文件,将其转换为字符串,使用正则表达式删除指向您不需要的外部资源的链接,然后将结果加载到 HTMLLoader 中。

Perhaps convoluted, but you could load the file with URLLoader, convert it to a string, use regex to remove links to the external resources you don't want, and then load the result into the HTMLLoader.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文