screen-scraping

screen-scraping

文章 0 浏览 4

通过 Web 服务 API 进行 Web Scraper?

我将如何进行以下操作... 我想为我的应用程序构建一个 Web 服务,以从外部网站获取一段数据,这需要用户登录。该网站没有公共 API,这就是抓取工具的…

滿滿的愛 2024-10-08 20:04:34 2 0

如何获取网页内容并将其保存到字符串变量中

如何使用 ASP.NET 获取网页内容?我需要编写一个程序来获取网页的 HTML 并将其存储到字符串变量中。…

等待我真够勒 2024-10-08 12:15:37 3 0

登录 ASP.NET Web 表单的 Java 方法

我正在开发一个 java 程序,该程序需要登录 ASP.NET Web 表单,然后经过身份验证后下载文件。正常的 HTTP GET/POST 不是问题,但当我从 java 连接时,…

掀纱窥君容 2024-10-08 10:37:48 5 0

如何读取屏幕上的像素?

我正在尝试为网页游戏制作一个简单的机器人,所以我希望能够读取屏幕上像素的颜色。我已经在 Windows 上使用 GetPixel() 完成了此操作,但我似乎无法…

陌上芳菲 2024-10-07 10:34:42 2 0

您如何下载网站?

搜索引擎机器人抓取网络并下载他们访问的每个页面进行分析,对吗? 他们究竟如何下载页面?他们以什么方式存储页面? 我问这个问题是因为我想对几个网…

情定在深秋 2024-10-07 10:21:15 2 0

用铁轨进行刮擦的耙子任务

我开始编写抓取工具来从不同的网站获取数据。我在 rake 文件中构建了第一个抓取工具,现在开始编写第二个 rake 文件以从第二个站点获取数据。目前,我…

谜兔 2024-10-07 08:04:06 1 0

WebHarvest 中的 Xquery 错误

我正在使用 WebHarvest 来解析一些 html。我在 WebHarvest 的 ide 中的以下函数中收到以下错误,我不明白出了什么问题。我正在尝试创建一个修剪字符串…

情深缘浅 2024-10-07 01:21:20 1 0

BeautifulSoup:如何从包含一些嵌套
      列表中提取所有

我是一名新手程序员,试图通过构建一个脚本来跳入Python,该脚本可以抓取 http://en.wikipedia .org/wiki/2000s_in_film 并提取“电影标题(年份)”…

另类 2024-10-06 19:50:56 0 0

用java抓取主机屏幕的屏幕?

Closed. This question is seeking recommendations for software libraries, tutorials, tools, books, or other off-site resources. It does not …

蓝礼 2024-10-06 15:52:18 0 0

Objective-C 中的 Hpple 找不到特定对象(XML/HTML 解析器)

对于那些没有尝试过 Hpple 的老手来说,这非常棒。它使用 Xpath 来搜索 HTML/XML 文档。它可以完成工作,而且对于像我这样的新手来说很容易理解。但是…

随波逐流 2024-10-06 13:54:20 1 0

对于在没有现有 API 的情况下挂接到站点的应用程序的语言/框架的建议

我想建立一个网站,这将增强现有网站的功能。目前该网站没有 API(显然它正在开发中),因此据我了解,我必须抓取页面以获取我需要的内容。 我使用过 …

浅听莫相离 2024-10-06 12:07:02 3 0

使用 Zend_Dom 作为屏幕抓取工具

如何? 更重要的是...... 这个: $url = 'http://php.net/manual/en/class.domelement.php' $client = new Zend_Http_Client($url) $response = $clie…

贵在坚持 2024-10-05 12:06:20 3 0

简单的 Firefox 插件教程

Closed. This question does not meet Stack Overflow guidelines. It is not currently accepting answers. 要求我们推荐或查找工具、库或最喜欢的…

纵性 2024-10-04 19:59:03 3 0

如何创建存储在数据库中的 html 内容的缩略图

如果您要将此 html 内容转换为小缩略图,您会怎么做? PS 我试图这样做是为了允许我网站上的用户浏览他们的帖子(包含 html 元素(例如,strong、i、i…

多彩岁月 2024-10-04 18:07:22 4 0

挂钩/抓取 .NET 应用程序

我想为万智牌在线创建一个交易机器人。如果这是一个问题,这样做不会违反使用条款,并且存在多个此类机器人的供应商。我最初从 DLL 注入/API 挂钩路径…

妄想挽回 2024-10-04 12:04:48 5 0
更多

推荐作者

烙印

文章 0 评论 0

singlesman

文章 0 评论 0

独孤求败

文章 0 评论 0

晨钟暮鼓

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文