我应该如何安排一天内多次 Google 搜索抓取?
目前,我的 Nokogiri 脚本会迭代 Google 的 SERP,直到找到目标网站的位置。它对每个用户指定的每个网站的每个关键字执行此操作(用户可以跟踪的网站…
将 MySQL 查询发送到我从另一个站点拥有的站点(使用 Google Chrome 扩展)
我想编写一个 Google Chrome 扩展程序,它可以从我不拥有的网站 (www.notmysite.com) 获取信息,将该信息发送到我拥有的网站 (www.mysite.com),并执…
Chrome扩展:如何将变量从内容脚本传递到background.html
我不知道如何将变量(或变量数组)从内容脚本传递到后台页面。我想做的是用我的内容脚本找到某些 DOM 元素,然后将它们发送到我的后台页面,以便我可…
如何使用现有的 Windows 功能从 UI 中提取文本
我环顾四周,发现了与此相关的各种零碎信息,但没有什么具体的。 我需要找到一种除 Spy++ 工具之外的提取 UI 元素的方法。我能够根据 HWND 定位屏幕项…
ASP.NET 网页抓取超时问题
我正在尝试实现一个网络抓取爬虫作为我的 ASP.NET MVC 项目的一部分。它使用 Html Agility Pack 处理从不同 URL 收集的大数据。问题是,当我想实际运…
Groovy htmlunit getFirstByXPath 返回 null + OCR问题
我最近在 HtmlUnit 返回空值方面遇到了一些问题,正在寻求指导。我抓取网站第一行的每个结果都返回 null。我想知道是否有人可以 A) 解释为什么他们可…
使用 C# 屏幕抓取 HTML
Closed. This question needs details or clarity. It is not currently accepting answers. 想要改进这个问题?通过编辑这篇文章添加详细信息并澄清…
有类似 Watin 的东西可以用于 C++ 吗?
我想知道是否有像 Watin 这样的项目可用于 C++(在 Windows 上),或者我是否只需要使用 QtWebkit。 有谁知道有什么好的 IE 自动化库可以在 C++ 中正…
设计专门用于渲染文本的开源 OCR 引擎(截图)
所以我目前的个人项目是能够自动抓取游戏的屏幕截图,对文本进行 OCR,并计算给定单词出现的次数。 在花了整个晚上研究不同的 OCR 解决方案后,我开始…
Celerity - 帮助 popup_browser 选择列表更新主浏览器上的 div 文本
我正在屏幕抓取一个页面,其中包含一个链接,该链接会生成一个弹出窗口,该窗口由一个选择列表和一个用于执行选择的按钮组成。目的是单击主页上的链接…
抓取 IMDB 的前 250 名列表会给出一些外语结果吗?
我让我的服务器抓取此页面来下载我正在进行的电影分析的完整列表: http://www.imdb.com/chart/top 但是当它做了很多电影标题以另一种语言出现。例如…