screen-scraping

screen-scraping

文章 0 浏览 3

如何捕获屏幕片段并与用户共享

有时您可能喜欢某个网页中的屏幕片段,理想情况下您希望捕获该片段,并可能向用户界面的一部分添加一些注释。有什么样的工具可以捕获这些信息并与其他…

私藏温柔 2024-09-26 15:04:54 0 0

网页抓取:按 javascript 按钮

我正在尝试抓取网页并接收我需要按下按钮的数据。这是按钮的源代码: "a class="press-me_btn" href="javascript:void( NewPage['DemoPage'].startDem…

土豪 2024-09-26 09:43:12 0 0

使用 Javascript/html5 进行所见即所得的网页抓取/爬行设置?

我的目标是允许经验不足的人设置从网站上抓取一些信息所需的参数。 这个想法是用户输入一个 URL,然后将该 URL 加载到框架中。然后,用户应该能够选择…

一枫情书 2024-09-26 05:19:50 2 0

使用 anemone 和 nokogiri 进行屏幕抓取需要帮助

我有一个 http://www.example.com/startpage 的起始页面,其中包含 1220 个列表以标准方式分页,例如每页 20 个结果。 我的代码可以解析结果的第一页…

反话 2024-09-25 15:35:12 2 0

如何使用cxfreeze打包scrapy项目?

我有一个 scrapy 项目,我想为使用 Windows 的客户将其全部打包在一起,而无需手动为它们安装依赖项。我遇到了 cxfreeze,但我不太确定它如何与 scrap…

撩发小公举 2024-09-25 00:12:29 2 0

如何在 ruby​​ on Rails 中优雅地失败并在屏幕抓取失败时收到通知

我正在开发一个 Rails 3 项目,该项目严重依赖屏幕抓取来收集数据,主要使用 Nokogiri。我基本上聚合了所有相同的数据,但我从许多不同的来源获取它,…

简单爱 2024-09-25 00:11:34 2 0

在 Linux 上捕获虚拟打印机输出

我正在为 3270 大型机编写一个 Java 屏幕抓取应用程序,而不是一页一页地滚动 80x24 字符,我想将所有页面输出到打印机,然后捕获并解析打印机输出。 …

情话难免假 2024-09-24 18:30:52 2 0

使用 DOMDocument 和 XPath 访问子 div

我正在构建一个供个人使用和学习目的的基本屏幕抓取工具,因此请不要发表诸如“您需要征求许可”等评论。 我尝试访问的数据结构如下: &lttr&gt &lttd…

暗喜 2024-09-19 18:55:14 3 0

在 PHP 中使用 POST 变量抓取 ASP.Net 网站

在过去的几天里,我一直在尝试抓取一个网站,但到目前为止还没有成功。 情况如下: 我试图抓取的网站需要之前提交的表单中的数据。我已经识别了 Web …

时光病人 2024-09-19 07:17:35 2 0

如果我们只有图像,如何发现面积图数据?

面积图(图像)有几个数据系列,这些数据系列用不同的颜色绘制。我们知道图像的大小和x轴上每个标签的坐标,是否可以通过图像识别来发现y轴的系列?有…

筑梦 2024-09-19 03:37:11 3 0

一些 If 语句、一些 html 调查和网络浏览器

我有一个代码可以在此链接中单独检索所有“地名”和所有“地址”: http://www.yellowpages.ca/search/si-geo/1/sh/Ottawa,+ON 我需要修改我的代码,…

燃情 2024-09-18 22:58:17 4 0

从博客和其他网页中智能提取标签

我不是在谈论 HTML 标签,而是用于描述本网站上的博客文章、YouTube 视频或问题的标签。 如果我只抓取一个网站,我只需使用 xpath 来提取标签,甚至使…

眉目亦如画i 2024-09-17 20:17:00 3 0

屏幕抓取一个阻止 ip 的网站

你好,我想屏幕抓取像 yelp 这样的网站来获取意大利餐馆的电话号码。我创建了一个简单的程序来执行我想要的操作,但他们阻止了我的服务器 IP, 我正在…

梨涡 2024-09-17 00:44:19 4 0

需要从多个站点获取div的内容

我想获取 newegg 的产品价格。这是此网站的一个示例网站 http://www.newegg.com/Product/Product.aspx?Item=**N82E16820167027** ,我想获取包含价格…

‖放下 2024-09-16 20:28:59 1 0

使用 grep 从本地文件中的 HTML 标记内获取文本

可能的重复: RegEx 匹配开放标记(XHTML 自包含标记除外) 输入文件摘录 &ltTD class="clsTDLabelWeb" width="28%"&gtMunicipality:&ampnbsp&lt/TD&…

眼眸里的快感 2024-09-16 13:06:41 1 0
更多

推荐作者

lioqio

文章 0 评论 0

Single

文章 0 评论 0

禾厶谷欠

文章 0 评论 0

alipaysp_2zg8elfGgC

文章 0 评论 0

qq_N6d4X7

文章 0 评论 0

放低过去

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文