下载包含图像和样式表的网页并(可选)通过电子邮件发送
我需要使用 PHP 以编程方式制作网页快照,并将它们放入 HTML 电子邮件中。 我尝试了wget --page-requirements。它可以正常下载所有内容,但不会更改 H…
最好的屏幕抓取工具,简单的 html dom 还是史努比?
哪一种更适合屏幕抓取? 简单的 html dom 或 snoopy ? 我使用简单的 html dom 并发现它很舒服.. snoopy 与简单的 html dom 相比有什么优势吗? 我的…
付费 API 来获取网站的传入链接?
我正在开发一个 SEO 应用程序,该应用程序(除其他外)显示随时间推移指向您网站的传入链接数量。 有几种方法可以获取此数据。抓取 Google“link:your…
如何从数据库记录中删除所有 html,而不是创建 xml 文件?
我想找出一种方法从数据库中的记录中删除所有 html 标签,然后创建 xml? 有什么想法吗? 基于 asp.net 2.0 和 sql server 构建…
有没有办法以这种格式抓取Flash?
是否可以抓取此小程序 http://www.text118118.com/livefeed.aspx 传统上不可能做到这一点,因为文本位于小程序内,但是可以使用宏来做到这一点。 提要…
PHP 与 Google 的抓取问题“我感觉很幸运”
我正在尝试使用 Google“手气不错”按钮进行抓取。 对于像“iteminfo.ca”这样的小查询,它可以工作,因为它将我重定向到 iteminfo.ca。 这是查询网址…
来自加拿大邮政的 CURL/屏幕抓取递送跟踪详细信息
我需要从加拿大邮政网站获取递送跟踪详细信息,该网站不提供 API。 我已经制定了一个 URL,当输入到浏览器中时,它会正确返回跟踪信息,但我无法获取…
使用 Hpricot (Ruby on Rails) 抓取隐藏的 HTML(当visible = false 时)
我遇到了一个问题,不幸的是我似乎无法超越,不幸的是,我也只是 Ruby on Rails 的新生儿,不幸的是,因此 我试图抓取网页的问题数量如下: http://ww…