ActionScript 不使用 HTMLLoader 加载 HTML 资源
我目前正在通过 ActionScript HTMLLoader 下载网站,以便稍后访问 DOM 以从页面中获取一些信息。
问题是:页面上链接的每个资源(图像、样式表、javascript)也会加载,这需要一些额外的时间。我并不真正需要这些资源,因为只有纯 HTML/DOM 才有趣。
有什么办法可以禁用链接资源的加载吗?起初,我尝试使用 URLLoader 并将结果解析为 XML,但是当网站无效时,这不起作用。我也没有找到一个库可以将给定的 HTML 字符串验证/解析为有效的 XML。
我在桌面上使用 Adobe AIR。
I'm currently downloading website via an ActionScript HTMLLoader to later have access to the DOM to get some information out of the page.
The problem is: each resource that is linked on the page (images, stylesheets, javascript) is also loaded which takes some additional time. I don't really need those resources, because only the plain HTML/DOM is interesting.
Is there any way to disable loading of linked resources? At first I tried using an URLLoader and parse the result as XML, but when the website isn't valid this doesn't work. I also didn't find a library that validates/parses a given HTML-string into valid XML.
I'm using Adobe AIR on desktop.
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
也许很复杂,但您可以使用 URLLoader 加载文件,将其转换为字符串,使用正则表达式删除指向您不需要的外部资源的链接,然后将结果加载到 HTMLLoader 中。
Perhaps convoluted, but you could load the file with URLLoader, convert it to a string, use regex to remove links to the external resources you don't want, and then load the result into the HTMLLoader.