screen-scraping

screen-scraping

文章 0 浏览 5

如何查找“”中的href元素值用红宝石标记

我的目标是找到谷歌搜索结果中的第一个结果并收集站点链接,所以我构建了这个脚本: require 'hpricot' require 'open-uri' require 'mechanize' quer…

太阳哥哥 2024-10-30 15:38:08 6 0

如何抓取将所有交互都作为回发进行的 ASP.NET 站点?

我使用 Python 为 ASP.NET 站点(特别是 Jenzabar 课程搜索 portlet)构建了一个抓取工具,它将创建一个新会话、加载第一个搜索页面,然后通过回发所…

私野 2024-10-30 06:26:40 3 0

使用 scrapy 抓取多个域的最佳方法是什么?

我希望从中刮掉大约10个奇数网站。其中一些是WordPress博客,尽管有不同的类别,但它们遵循相同的HTML结构。其他是其他格式的论坛或博客。 我喜欢刮擦…

旧时光的容颜 2024-10-29 00:28:42 7 0

哪些应用程序或库可用于 Windows 上的屏幕抓取应用程序?

我们开发了一个应用程序,客户可以与内部定制软件并行使用。我们的一位客户要求我们调查屏幕抓取软件的使用,以在两个应用程序之间提供某种集成层。 …

梦魇绽荼蘼 2024-10-27 01:27:24 6 0

在 Node.js 中进行屏幕抓取的最优雅的方法是什么?

我正在编写一个 Web 应用程序,该应用程序在 Node.js 中使用大量的屏幕抓取。我感觉自己在每个角落都在与潮流作斗争。必须有一种更简单的方法来做到这…

娇妻 2024-10-26 23:16:54 3 0

使用 PHP DOM 函数从 HTML 文件中提取数据的最佳方法是什么?

我需要从各种 HTML 文件中提取大量数据,并且我必须为每种类型的 HTML 文件编写单独的脚本,以便正确解析出我需要的数据。 数据将位于文档的不同部分 …

少女的英雄梦 2024-10-26 06:23:05 2 0

如何同时运行多个 nokogiri 屏幕抓取线程

我有一个网站,需要在许多不同的网站上使用 Nokogiri 来提取数据。这个过程使用delayed_job gem 作为后台作业运行。然而,每个页面运行大约需要 3-4 …

黑色毁心梦 2024-10-25 00:04:30 4 0

无法使用 Python urllib2 加载 ASP.NET 页面

我正在尝试向 https://www. paoilandgasreporting.state.pa.us/publicreports/Modules/WellDetails/WellDetails.aspx 以抓取数据。 这是我当前的代码…

不离久伴 2024-10-24 18:10:33 5 0

检测网页抓取的方法

我需要检测我网站上的信息抓取。我尝试过基于行为模式的检测,尽管计算量相对较大,但它似乎很有希望。 其基础是收集某些客户端的请求时间戳,并将其…

回眸一遍 2024-10-23 18:17:09 7 0

如何编写可以浏览网页并在网页上执行操作的自动化机器人

我需要编写一个需要执行以下操作的机器人: 转到 jsp 页面并 通过以下方式搜索内容: 1:在搜索框中写一些内容 2:单击搜索按钮(提交按钮) 3:单击…

公布 2024-10-22 11:26:48 6 0

为什么 HTMLunit 在这个 https 网页上不起作用?

我正在尝试了解有关 HTMLunit 的更多信息并目前进行一些测试。我正在尝试从此网站获取页面标题和文本等基本信息: https://....com(删除了完整的网址…

土豪 2024-10-22 06:42:22 3 0

SIMILE 溶剂有替代品吗?

麻省理工学院的 SIMILE 项目 开发了一系列可用于浏览器内屏幕抓取的工具,即 存钱罐,溶剂和Crowbar。这些项目现在看来已经不复存在了;自 2008 年以…

陌上青苔 2024-10-21 18:47:54 9 0

屏幕抓取 PDF 链接下载

我正在通过创建一个小程序来学习 C#,但找不到类似的帖子(如果这个答案发布在其他地方,我深表歉意)。 我如何在网站上进行屏幕抓取以获取 PDF 链接…

街道布景 2024-10-21 17:01:21 6 0

HTML DOM 解析器 - 如何获取论坛中所有主题的第一篇文章

我试图废弃 sitepoint javascript 论坛中每个主题的第一篇文章。但是 DOM 解析器会给我 SITE POINT JAVASCRIPT 论坛中每个主题的所有帖子。也许我没有…

审判长 2024-10-21 09:14:50 4 0

为您无权访问的网站创建移动网站

我想为我的高中检查我们成绩的网站创建一个移动网站。实际上,我想远程登录到门户,然后进入学生成绩所在的子页面并抓取它们。据我所知,该门户没有 A…

十年九夏 2024-10-21 04:32:28 2 0
更多

推荐作者

苍风燃霜

文章 0 评论 0

悸初

文章 0 评论 0

撧情箌佬

文章 0 评论 0

森罗

文章 0 评论 0

lyn1245

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文