通过 Web 服务 API 进行 Web Scraper?
我将如何进行以下操作... 我想为我的应用程序构建一个 Web 服务,以从外部网站获取一段数据,这需要用户登录。该网站没有公共 API,这就是抓取工具的…
登录 ASP.NET Web 表单的 Java 方法
我正在开发一个 java 程序,该程序需要登录 ASP.NET Web 表单,然后经过身份验证后下载文件。正常的 HTTP GET/POST 不是问题,但当我从 java 连接时,…
WebHarvest 中的 Xquery 错误
我正在使用 WebHarvest 来解析一些 html。我在 WebHarvest 的 ide 中的以下函数中收到以下错误,我不明白出了什么问题。我正在尝试创建一个修剪字符串…
BeautifulSoup:如何从包含一些嵌套的列表中提取所有- ?
- 列表中提取所有
- ?
我是一名新手程序员,试图通过构建一个脚本来跳入Python,该脚本可以抓取 http://en.wikipedia .org/wiki/2000s_in_film 并提取“电影标题(年份)”…
用java抓取主机屏幕的屏幕?
Closed. This question is seeking recommendations for software libraries, tutorials, tools, books, or other off-site resources. It does not …
Objective-C 中的 Hpple 找不到特定对象(XML/HTML 解析器)
对于那些没有尝试过 Hpple 的老手来说,这非常棒。它使用 Xpath 来搜索 HTML/XML 文档。它可以完成工作,而且对于像我这样的新手来说很容易理解。但是…
对于在没有现有 API 的情况下挂接到站点的应用程序的语言/框架的建议
我想建立一个网站,这将增强现有网站的功能。目前该网站没有 API(显然它正在开发中),因此据我了解,我必须抓取页面以获取我需要的内容。 我使用过 …
使用 Zend_Dom 作为屏幕抓取工具
如何? 更重要的是...... 这个: $url = 'http://php.net/manual/en/class.domelement.php' $client = new Zend_Http_Client($url) $response = $clie…
简单的 Firefox 插件教程
Closed. This question does not meet Stack Overflow guidelines. It is not currently accepting answers. 要求我们推荐或查找工具、库或最喜欢的…
如何创建存储在数据库中的 html 内容的缩略图
如果您要将此 html 内容转换为小缩略图,您会怎么做? PS 我试图这样做是为了允许我网站上的用户浏览他们的帖子(包含 html 元素(例如,strong、i、i…