寻找 Webzinc .NET、屏幕抓取、.NET Web 自动化库的免费替代品
Closed. This question is seeking recommendations for software libraries, tutorials, tools, books, or other off-site resources. It does not …
YQL 抓取整个网站/域
我正在尝试从域中恢复一组链接和内容。 谷歌中的查询是 "site:www.newswebsite.com search_term" 我已经看到了一些接近的东西来实现这个工作,但我似…
大学课程网站的网络抓取/解析
尝试解析/抓取孟菲斯的课程网站。该网站是“https://spectrumssb2.memphis.edu/pls/PROD/bwckgens。 p_proc_term_date”。这似乎是某种 JavaScript 问…
使用 JavaScript 的编程式 Python 浏览器
我想对一个使用 JavaScript 的网站进行屏幕抓取。 有 mechanize,Python 的编程 Web 浏览器。然而,它(可以理解)不解释 javascript。有没有 Python …
无法抓取包含格式错误内容的网页
我编写了 C# 代码,它利用 HtmlAgilityPack 库来抓取位于以下位置的页面: 世界上最大的城市区域 (第 2 页)。不幸的是,该页面包含格式错误的内容。 …
如何将屏幕保存为 C# 中 .NET 表单应用程序的图像
我有一个 .NET 3.5 Windows 窗体应用程序。当用户输入数据并单击“保存”时,我想将整个表单保存为图像文件。 我该怎么做? 谢谢, 查克。…
PHP、Zend Framework:如何从另一台服务器获取页面,然后传递内容?
我想这也可以称为“抓取”。基本上,我想做的是,如果有人点击此链接: Click here 我希望我的 links 控制器、display 操作: 从数据库中查找链接 #47…
Beautifulsoup 在表中获得价值
我正在尝试刮 http://www.co.jefferson.co.us/ ats/displaygeneral.do?sch=000104 并获取“所有者姓名” 我所拥有的有效,但真的很难看,而且不是我确…
下载包含图像和样式表的网页并(可选)通过电子邮件发送
我需要使用 PHP 以编程方式制作网页快照,并将它们放入 HTML 电子邮件中。 我尝试了wget --page-requirements。它可以正常下载所有内容,但不会更改 H…