如何在此上下文中使用 WebClient.DownloadDataAsync() 方法?
我的计划是让用户在我的程序中写下电影标题,我的程序将异步提取适当的信息,这样 UI 就不会冻结。 这是代码: public class IMDB { WebClient WebCli…
处理屏幕抓取对象的更好方法
在我的应用程序中,我总是最终实现模型-视图-演示者模式,并且通常最终会使用 get 属性从屏幕上废弃我的视图对象。 例如 Person IBasicRegistration.P…
Scrubyt 获取元数据
如何使用 Scrubyt 获取元名称=“描述”内容=“.....”的内容? require 'rubygems' require 'scrubyt' data = Scrubyt::Extractor.define do fetch 'h…
屏幕抓取应用程序(非 HTML)
I need screen scraper application which will recognize text from the screen (and not use winapi to do this so source could be in image file)…
如何在 python 中下载具有正确字符集的任何(!)网页?
问题 当使用 python 对网页进行屏幕抓取时,必须知道页面的字符编码。如果字符编码错误,那么输出将会混乱。 人们通常使用一些基本技术来检测编码。它…
如何防止有人窃取 API feed?
我已经开始开发一个网页,最近雇了一个人编写代码,在 http 的中间面板中显示自定义提要(由 API 提供支持) ://farmball.com/。 请注意,这不是与网…
C# - 从现有进程中读取文本
我们必须从现有的 VB6 应用程序中读取文本。因此,我们使用kernel32之外的FindWindow、GetWindowText和EnumChildWindows方法,可以枚举并读取该过程中…
原型js获取具有特定值的元素
我正在抓取一些数据,我想在具有值的特定标签之后获取元素的值。 它是一个粗体标签,值为“Types:”。 <b>Types:</b> 一旦到达该元素,我就可…
如何判断字符串中的空白类型?
我正在从 10 年历史的网站 中抓取一些信息,该网站是使用 Frontpage(最初)和 Dreamweaver 在 ASP 中构建的(最近)。我正在使用 PHP。 我正在返回带…
onload javascript 后 HTML 的状态
许多网页使用 onload JavaScript 来操作它们的 DOM。有没有办法可以在这些 JavaScript 操作之后自动访问 HTML 的状态? 像 wget 这样的工具在这里没有…